
生物演化中有所謂的寒武紀大爆發,指的是從寒武紀開始,生物的多樣性突然暴增,其中認為很重要的關鍵是生物在這個時期開始演化出眼睛這樣的結構。因為有了視覺功能就更能適應這世界;AI也是一樣,除理解人類語言,還可以因為機器學習產生更強大能力,例如使用視覺。
台北西區扶輪社前天會議中,安排一場關於生成式AI的演講,吸引眾多目光。講者尹相志開場以一段由人類作詞、剪接,但由生成式AI包辦作曲、歌唱以及影像生成的音樂影片開場。這段音樂影片讓人感受到AI技術進展飛快,也傳達一年以來生成式AI何以能席捲全世界這樣紅。
尹相志擅長數據科學,在大數據行業累積有20年資歷。2002年成立台灣第一家大數據顧問公司asiaMiner,協助大型電信、銀行、零售業等產業導入數據科學相關應用,也是台灣微軟數據科學領域的特約講師,2006-2017年並獲微軟最有價值專家(MVP),目前為中保、光寶與啓雲科技顧問。
這場演講,尹相志深入講述透過ChatGPT實現複雜任務,以優化外籍人士歸化台灣流程為例。從概念對齊的重要性,展示利用ChatGPT的角色扮演功能,扮演經常與外籍人士接觸的外商HR專家,藉以獲取外籍人士寶貴意見。透過這種方式,ChatGPT提供關於改進歸化流程的具體建議。
同時,在外籍人士歸化台灣流程得到改進後,再次示範如何利用ChatGPT角色扮演功能,扮演政治公關專家撰寫引人入勝的文案並優化初稿不足的地方。在他調整指令要AI以Apple聚焦用戶體驗與價值的寫作風格優化文案下,文案標題從「迎接全球夥伴,我們讓國籍流程更親近你」一變為「重新定義家的感覺/一切,為了你」,更能傳達歸化流程的人性化、便捷性,也更吸睛。

尹相志強調,僅用白板上手繪APP介面草圖,利用ChatGPT來生成相應的程式代碼,說明即使沒有程式寫作技能,人們也能有效利用AI寫程式。同時展示生成式AI閱讀K線圖技術分析、判斷路況、讓ChatGPT扮演扶輪社會長小助手,展示如何協助規劃例會活動並創作宣傳文案插圖,證明AI在各個領域的應用潛力。
尹相志解釋,過去判別式AI,如同讓機器學會解答選擇題,能得高分但未必真的理解事物;生成式AI就不一樣,如同讓機器回答申論題,如不夠正確馬上就會被看破手腳,也因此生成式AI的迭代進化更快速。
他以midjourney晚近幾代效果展示說明,作品從早期形狀扭曲模糊的圖象直到後期幾可亂真,清晰展示生成式AI在藝術創作上的演化,「早期還可透過手指數量以及位置不正確來判斷哪些圖是機器畫的,但現在已經難分真假」。
在不同的示範下,尹相志先後展示如何用文字來讓機器畫出想像中的生物組合,他同時強調,文字開啟不同的AI世界,機器不再沒教就不會,透過文字描述與理解,AI可以畫出、寫出沒有的新內容,如何將文字轉為視覺藝術作品,正是生成式AI的關鍵。
尹相志利用圖像轉圖像的AI技術,將一張普通女孩合照轉換成芭比風的黏土動畫版迪士尼公主,豔驚四座;更凸顯AI在視覺藝術領域的應用潛力。演講的高潮在於展示由AI生成的紅色月球衝撞地球的圖片將其轉化為動畫,背景音樂也是AI作品,這一幕觀眾驚嘆不已。
然而,尹相志也指出生成式AI的侷限,尤其是所謂的「幻覺」問題,即AI有時會基於錯誤資訊或邏輯做出判斷;「用工具」是人類智慧發展的關鍵能力,尹相志說,現在我們正處於一個選擇是否使用AI作為新工具的時代。
過去,使用AI需要學習機器語言寫程式,但現在AI技術已能理解人類語言,降低使用機器的門檻。從人類學習機器語言到機器學習人類語言,現在的生成式AI更親民且易上手,應用範圍更廣,也將為生活與工作帶來重大變化。