在 NVIDIA 開發者計畫技術支持下,今(1)日臺灣訓練完成並首創繁體中文專家模型的開源專案Project TAME(TAiwan Mixture of Experts)問世,正式啟動臺灣AI新起點。這項專案跨產業共創育成,發起人包括長春、和碩、長庚醫院、欣興電子、科技報橘等企業與台大資工系、資管系以及律果科技產學合作。
Project TAME 能使用在地文化與術語協助台灣產業快速導入生成式人工智慧(GAI)並落地應用;一般企業從零開始訓練10億參數模型,約需耗資台幣3.8億、費時576小時,目前導入Project TAME 700億參數模型,成本約台幣1,600萬且每3.5小時模型就可迭代一次,大幅降低導入成本與時間,同時助力快速優化企業在運營管理、人員訓練、產品服務、客服等多元AI應用。
計劃主持人台大資工系副教授陳縕儂,帶領實驗室同仁與企業夥伴團隊共同開發,採用 NVIDIA 開發者計畫技術支持,供多家垂直產業的企業專家提供領域知識,預訓近 5 千億個字(token)開發出繁中大語言專家模型。未來,Project TAME將以開源模型(Open Model)形式拋磚引玉,邀請更多產業加入共創「台灣產業專用 AI 應用生態系」。
首批投入 Project TAME的產業知識,主要來自共同發起單位的領域知識,包括:石化業、電子製造、醫療服務、內容服務、法律等,在完全沒有簽約、產學自發性合作下,短短數月已具初步成效,相較全球其他繁中模型在各項相關指標評比中,一路領先。
以使用Project TAME測試台灣「大學學測、律師/中醫考試、導遊證照、駕照、台灣在地化測驗等,分數優異」,在39類近3000題綜合評測中,得分超過所有模型,其中,正確率較第二名模型Claude-Opus高出 6.8%;甚至比 GPT-4o 高出 9.3%。
長春集團(大連)董事長林顯東說,他觀察到中國石化業正以前所未有的速度擴張,台灣可能要花30年才能推進 100 萬噸產能,中國在兩三年間,就超車直上 200 萬噸。因此,長春集團加入團隊,期能應用 AI 預測分析,更快得知獲利、產品競爭的商機與可能出現的風險。
和碩表示,參與 Project TAME目的在透過開放式聯盟的創新合作,結合跨域專家資料以及學界大型語言模型的專業,加速產業內GAI應用、及早實現AI落地。和碩說,從設計到系統化生產製造服務等相關技術的開發,一直嘗試導入 AI 的可能,並積極發展 AI 製造應用。
林口長庚醫院院長陳建宗表示,藉由參與 Project TAME,啟動 AI 輔助醫療與照護的新紀元。將 AI 繁中大型語言模型導入醫療第一線,醫師只要在病歷上搜尋資料,就會彈出視窗顯示,以前沒那麼方便,現在整合所有資料,又符合醫師作業習慣。
欣興電子除合作建立公開的繁中專家模型,也將透過公司內部資料庫,調校成內部專用的產業專家模型,預期在未來可為專業知識問答,提供更符合公司內部作法的準確建議,提升工作效率。
科技報橘指出,目前大型語言模型已被證明在內容創作、研究分析情報和個人化等範疇有具體進展。科技報橘已使用未經繁中優化的大型語言模型推出測試內容,在官網 AI 人機協作專區已可看到,但這一年的實驗顯示,勢必需要有繁中優化的大型語言模型,才能提供社群用戶更好的服務。
律果科技表示,法律內容有很強的在地化需求,因此協助 Project TAME 加入台灣法律語料進行訓練。台大資工系將目前各大型語言模型試用在台灣律師考試題目上,Project TAME 分數均超過所有其他模型。
繁體中文專家模型 Project TAME 正式對外發布後,將採用 Open Source 開放原始碼的形式,讓各產業企業有一個 Hub 中心可以進行合作。陳縕儂指出,在不同資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。
Project TAME目前已開放企業免費下載、提供聊天頁面以及由亞太智能機器(APMIC)整合 Project TAME提供的聊天機器人測試頁,有意加入本模型的企業,可以下載測試使用。
延伸閱讀
- GAI風靡全球 工研院:智慧通訊新未來
- 淨零 永續 GAI 驅動企業轉型重塑
- AI新世代 GAI引爆電子零組件新商機
- NVIDIA GTC登場 新漢秀軌道車載解方
- NVIDIA中原大學 全台首場LLM工作坊
- 長庚TAIDE啟動 GAI競賽獨領風騷