蕭閔云
大學畢業後在新媒體領域闖蕩,將邁入第10年,而此時此刻正在聲音市場探險,擔任數位行銷的角色,目標是將聲音產品的魅力傳遞給更多的人,同時也在摸索聲音產業永續成長的模式。對文字有無法放下的依戀,期許自己可以一直寫下去。
閱讀完整內容
懂玩ChatGPT還不夠! 實測6款職人超推工具
撰文/蕭閔云 照片來源/Shutterstock
連續幾個月下來,AI應用高速進展,這波ChatGPT浪潮掀起了許多討論,有關於Google、微軟兩巨頭的競爭,也有各派探討AI倫理的議題。除此之外,也有許多人意識到,在可見的未來裡,「詠唱術」或者說「使用AI的技術」,將成為工作者所必備的軟實力,其中令人興奮的正是看到許多團隊開發衍生的各種應用,而如何將這些工具應用在自己的日常中,是另一個有趣的話題。
為了不落人後,我用半個月的時間,實測了多款各網路大神無私分享的工具,結合自身使用體驗,整理了以下6款推薦應用!
#1 ChatGPT指令大全〉教小白下提示詞
首先,對於初試AI工具的小白如我,如何給予正確指令(prompt),是一個初學者必備的基礎技能,「ChatGPT 指令大全」網站,提供不同種類的指令範本,包括資料整理、履歷與自傳、程式開發、面試準備、英語學習等,開放使用者複製範本後簡單填空使用,幫助你更精準地指示AI為你提供服務。
例如,想請ChatGPT擬一篇關於內容編輯可採用的SEO策略文章草稿,參考指令範本輸入如下:
撰寫一篇文章題目為:「內容網站編輯可以採用的SEO策略(主題)」的草稿,結構需要完整。草稿中要包含5(數字) 個可以在內文中進一步闡述的要點。
在我輸入上述指令後,ChatGPT於1分鐘內擬好了帶有5大重點的SEO策略架構,且幾個關鍵項目都有提及並納入大綱中,確實可以快速地提供正在苦思文章結構的人,一個可參考的寫作方向。
#2 Chat YouTube〉免看影片也能問摘要
第二個實用工具是「Chat YouTube」,協助使用者快速摘要影片內容重點。只要將影片網址貼入,AI就會消化影片內容,開放使用者以提問的方式掌握影片要點。例如,我將《雪力的心理學筆記》「MBTI 16種人格類型解說系列之ENTJ特輯」這支約20分鐘的影片連結,貼入Chat YouTube,不到3分鐘的時間後,先摘要整理了影片重點,並開放提問,於是我接著提問關於:「ENTJ型人格的特色」、「ENTJ型人格如何良好發展」等,Chat YouTube接著以明快、簡潔的方式,為我列出幾大重點回應,可以幫助使用者快速掌握想從影片獲知的訊息。
不過,目前Chat YouTube還有2個不足之處。一是沒有字幕的影片無法使用。在以《雪力的心理學筆記》影片測試前,我先丟了一支吳叡人教授《雷震講座|帝國夾縫中的台灣民主》講座影片,但由於該片為實體講座側錄,且沒有後製字幕,因此Chat YouTube就無法作業。而第二個美中不足在於語言。雖然以繁體中文影片測試且提問皆使用中文,但Chat YouTube仍以英文介面為主,一開始的重點摘要以英文呈現,而問答回應顯示,系統是可理解繁體中文語意並有效摘要重點回應的,只是它提供的回應有時還是會以英文呈現,有時則以簡體中文回應,較不直覺。
#3 Chat with any PDF〉濃縮文件3亮點
另一個與Chat YouTube異曲同工的「Chat with any PDF」,使用情境與方式大致與Chat YouTube相同,將任何PDF文件上傳後,Chat with any PDF將消化整理出文件重點,並歸納文件可回應的3個主要問題,幫助使用者快速提問、掌握文件主要內容。
實際測試,將工作上使用的sales kit與產品提案簡報上傳後,雖是圖文並茂的文件檔案,仍可以掌握文件內的重點摘要。不過當我上傳一篇演講稿,不確定是否因為文字量或內容屬性,Chat with any PDF開始以英文回應,不過英文摘要的內容大致仍為正確資訊。
另外是Chat with any PDF有免費版跟付費版的差異,免費版一天的使用上限為3份PDF檔案,且頁數不能超過120頁,單一檔案大小不超過10MB,且一天最多只能詢問50個問題。
#4 Good Tape〉音檔轉逐字稿神器
「Good Tape」是這批試用工具中最愛的一款。使用 OpenAI 旗下 Whisper 技術,Good Tape是支援英文、中文、日文、韓文、德文、法文、丹麥文等超過 40 種語言的逐字稿工具。開發團隊為丹麥的數位媒體 Zetland,可說是一款專為記者打造的服務。
雖是專為記者打造,但實際上Podcast製作、影片創作者乃至行銷工作者如我,都用得上這款工具,只要將音檔上傳,等待數分鐘後,就會產出逐字稿,且可選擇加上timecode版、無timecode版及字幕版3種文件格式下載。
實測50分鐘採訪錄音檔,正確率約落在7至8成之間,相較過去使用過的逐字稿工具是高得多的,甚至在音檔內容提到書或作品時,還會自行加上書名號。不過免費註冊登入後,每月有3支音檔轉錄的使用上限,每個檔案最長90分鐘,且系統較忙碌時需要等候。不過整體使用體驗非常好,還可以將逐字稿丟進ChatGPT中校稿、重點摘要,大幅降低整理逐字稿的時間。
#5 Jitter〉無痛製作宣傳動畫
「Jitter」這款動畫生成工具,擁有多樣動畫模板,類型涵蓋廣告、社群、logo、UI設計等,選擇合適模板後進入編輯模式,僅需以類似PowerPoint動畫設定的操作模式進行簡單編輯,即可產出符合需求的動畫效果。
最初接觸這項工具,立刻想到的一個使用情境,就是產出社群宣傳的動態素材時。
以想要宣傳一檔即將上線的新節目為例,想在Instagram限時動態做一個簡易的宣告素材,使用Jitter提供的iOS手機訊息通知模板,編輯調整想要的文案與素材後,像是改掉背景圖、將傳訊人改為節目主持人、訊息文字改為節目開播宣告,且連訊息的icon也可以調整為LINE或是自家App的icon等,最後匯出等待,即可生成一支動畫短片。
#6 D-ID〉仿真人拍片活化文字
簡而言之,「D-ID」是一款AI合成影片工具。免費註冊登入後,只要上傳錄音檔或是鍵入台詞,再選擇希望呈現在的人物形象與人聲,即可製作擬真的人像影片。
D-ID開放使用者選擇的人像,包含真實人物以及AI生成的虛擬角色,同時也開放使用者上傳圖片。設想最適合應用的情境,是將各種生硬文字資訊轉化為動態呈現,例如將官網的常見問題集(FAQ)製作成由專人為客戶說明的影片、新進員工教育訓練影片、新聞播報等。
事實上D-ID製作出來的影片,還是看得出來是AI合成的產物,無法做到真正的自然,但之所以吸引我,是因為這是少數支援中文的影片生成工具,台詞可以輸入中文來製作影片,且有3種人物語音可選擇。儘管嘴形、動態表現及語音自然度都未臻完美,但已可針對特定使用情境,提供更簡便的影片生成方法。另外,也可拿來做網路迷因(meme)短片,例如用特定人物角色搭配趣味台詞等,當然這必須是在不涉及違法與侵犯個人權益的前提下。
在整理這篇工具文之後,我歸納一個小小心得:想透過這些工具來大幅提升生產力,還有一段距離。
事實上,為寫本文,前後實測數十款工具,其中被捨棄、不推薦的服務占了大半,理由並非它們難用,而是目前許多工具仍以英文為主,尚未支援中文,不符合平日的使用需求,像是email回信草擬工具,又或是PowerPoint生成工具等,功能是令人興奮、期待的,但暫且難以應用在我的日常生活。
另一方面,各種服務雖然多少都有令人眼睛為之一亮的效果,但畢竟現在尚處早期發展階段,許多應用仍停留在「小工具」的水準,有時甚至會需要多款工具複合式地搭配使用,才能真正有感地提高效率,而類似情形會讓人止步於嘗鮮,而未能進一步對工具產生黏著度。
不過,老派且一路讀文組的我,仍在實測中,深刻感受到未來相關應用的無限潛力,也讓我警覺,需要及早開始思考如何善用這些工具,優化自己的工作流程,相信未來這種系統性、整合性的思維,會成為每一個工作者的課題。
數位工具的大海真的是既深且廣,然而只要有緣遇上一款真正能幫助到自己的應用,接下來與那工具相伴的時光,可能是比世間任何關係都還要綿長、緊密的,這樣的邂逅實是不亞於與真命天子相遇的喜悅,期待在這個AI工具百花齊放的時代,每個人都能遇上幾個這樣的「夥伴」。