工業技術研究院 資訊與通訊研究所 黃維中副所長
站在時代浪潮上的人工智慧技術
人工智慧(AI)技術自1950年代的專家系統萌芽以來,歷經1980年代的機器學習及2010年代深度學習的突破,現今邁向以大型基礎模型為核心的生成式AI(Generative AI)時代。這項技術不僅改變了人類處理資訊的方式,更為各產業帶來新契機。
生成式AI利用巨量資料與高效能演算法進行深度學習來建立大型化基礎模型,可生成多樣化內容,包括文字、圖片、3D模型、影音、規格、程式碼等各種內容。從內容創作、商務服務、研發製造,到營運與供應鏈等產業應用,生成式AI正在改變我們的工作和生活。
回顧工研院自1980年代機器學習的時代就開始投入AI的發展,陸續投入光學文字辨識、自然語言處理、文字轉語音與語音辨識、電腦視覺等應用。從2000年起,在資料、演算法、算力的推波助瀾下,也進一步助長了人工智慧的快速發展:
- 巨量資料(Big Data):資料量的爆炸性成長,國家或企業開始重視資料蒐集、資料品質的精進,使AI模型能以更多元從精細的資料進行學習。
- 先進演算法(Advanced Algorithms):深度學習技術讓模型的訓練與推論更為精準。
- 高效算力(Computing Power):雲端運算與GPU的廣泛應用、晶片效能持續提升。
面對這樣的趨勢,工研院也陸續投入巨量資料應用創新、人工智慧產業應用的發展,而自2020年起,為了能將AI擴展到更多面向,包括水平與垂直產業應用,工研院也提出以「FAST」四個元素為主的應用發展方向,包括:
Federal Learning(聯合學習)
藉由分散式的機器學習方法,允許多個設備或伺服器在本地訓練模型,而不需將資料集中於中央伺服器。這種技術特別適合於需要高度資料隱私保護的場景,例如醫療、金融或大量的物聯網裝置,因為資料不需離開機構甚至是使用者設備。聯合學習不僅能有效利用分散資料,還能降低資料集中管理的風險。
除了聯合學習技術外,同態加密(Homomorphic Encryption)、零知識證明(Zero-Knowledge Protocol)、安全多方運算(Secure Multi-Party Computation)等,也是目前隱私強化技術(Privacy Enhancing Technologies)發展的重點。
AutoML(自動化機器學習)
將機器學習流程自動化,包括特徵工程、模型選擇、神經網路架構搜尋、超參數調整等,使非專業使用者也能輕鬆建構AI模型,降低了AI開發的門檻,縮短模型部署時間,特別適合中小企業或缺乏專業AI人才的組織,實現高效且精確的應用。
Self-supervision Learning(自我監督學習)
藉由資料內部的結構特徵進行自我訓練,降低對資料標記的依賴,提升無標記資料的利用率,尤其適合於自然語言處理和機器視覺領域,可大幅降低了人工標記資料的成本,並提高模型的泛化能力。
Transfer Learning(遷移學習)
藉由某一領域中學到的知識,應用於相關但不同的任務來提升學習效率。預訓練模型經微調後,能在資料有限的場景中實現優異的表現,加速模型開發過程,可做為解決少量資料問題的重要工具。
歷年來工研院藉由長久以來累積的巨量資料、人工智慧等技術與能量,加上FAST AI技術的加值,降低資料標記成本、解決資料孤島問題、加速模型開發,成功導入包括智慧製造、智慧醫療、智慧服務與智慧商務等諸多產業應用,讓人工智慧應用進入到企業、產線、用戶與消費者的工作與生活中。而這些應用所生的資料,也都具備再進一步以生成式AI技術來進行加值優化。
圖1 AI產業應用案例與生成式AI加值優化方向
生成式AI的崛起與工研院的投入
2022年開始,生成式AI應用受到廣泛的關注,各個國家、大廠、企業等紛紛前仆後繼投入大型基礎模型的發展。然而,期待AI或生成式AI能用在非常廣泛的場域,但是研發、導入一個具備產業實務應用價值的AI技術或系統,仍需要考量其可行性、實際效益與成本的平衡。尤其是近年以來各種AI技術、軟硬體皆不斷推陳出新,AI的導入更需要縝密且廣泛的評估。
工研院具備跨領域研發的先天優勢,原因是院內技術/應用林立是台灣產業生態的縮影與前瞻應用的先行者。對於生成式AI的因應策略與導入規劃自然也責無旁貸。藉由整合AI策略辦公室與全院跨單位團隊,分析台灣產業導入生成式AI的四大議題包括:
- 資料:整合並導入具特色優質資料庫;包括半導體、精密製造、健康醫療等,可藉由生成式AI來延續既有競爭優勢。
- 演算法:絕大部分的演算法皆是由全球頂尖的科學家或工程師所研發,台灣的重點在於挑選合適的模型、投入模型(預)訓練、提示工程、檢索增強、內容後處理;此外,依不同需求採中小型模型領域化、雲端大型模型加值化等方案。
- 算力:企業能力有限需整合國家或雲端服務業者的資源支持。透過搭配國家級高速電腦中心、雲端平台服務商提供高運算力機器,提供算力完成模型訓練與推論。
- 可信任:參循國際規範、法規與標準,建立國家、企業層級應用規範,確保AI的正向使用並重視AI的輸出品質。
在全院的整合下,目前也完成了工研院的AI科技研發的初步規劃,從GAI關連性、國際發展現況、國內可掌握之應用項目、國內產業需求、技術可行性及優勢、資料掌握度等六個面向,針對文字與圖片、3D與影音、規格與流程、程式代碼、擴增資料等資料或內容生成的對象,結合工研院「2035技術策略與藍圖」,以「智慧化致能技術」為基礎,並聚焦「智慧生活」、「健康樂活」、「永續環境」、「韌性社會」四大應用領域擘劃生成式AI科技研發的應用範疇:
1.內容與創作,包括分身、文創、虛擬偶像、公益應用,如:
n文創影視動畫:快速生成電影場景與角色動畫,極大地縮短製作週期。相較於傳統數位場景或角色動畫的創作,若能導入合適的生成式AI技術,可以降低所需的時間與成本。
n公益手語應用:結合手語轉譯、手語辨識技術,藉由分身或虛擬偶像,生成式AI可以成為聽障群體的重要溝通橋樑。
2.商務與服務,包括行銷、銷售、洞察、客服,如:
n行銷文案生成:以Amazon和Jasper AI為例,企業利用AI工具編寫行銷內容,縮短文案生成時間、降低成本。
n銷售商品建模:傳統商品建模費用高昂且耗時,既有3D建模方法缺乏細緻的擬真度,生成式AI的技術可加速高品質、具備真實物件質感的3D商品模型生成,並降低製作成本。
3.研發與製造,包括模擬、設計、編程、維修,如:
n程式語言編程:既有商用的生成式AI如GitHub Copilot已可為工程師提供即時程式碼建議。目前有愈來愈多比例的程式語言編碼是以生成式AI來輔助。
n低資源語言編程:如IC設計的RTL、工業製造的NC Code(G Code、M Code、T Code)、PLC Code等,則需進一步進行垂直領域模型訓練與調校。
4.營運及供應鏈,包括諮詢、行政、訓練、合規,如:
n教育訓練:以AI系統來輔助進行虛擬授課,或以AI教練系統模擬實際業務與應用場景,幫助新人或受測者快速掌握專業技能,縮短學習曲線,目前的案例包括金融領域的新手業務員培訓、醫療領域的OSCE訓練等。
n合規:針對企業營運所需要的各種ISO標準、領域主管機關訂定法規等,AI可協助企業進行自動化資料蒐集、彙整、以及分析。此外,針對部分有大量數位查證需求的領域,如企業碳盤查,可以用AI來輔助進行數位查證彌補人工查證能量不足的缺口。
圖2 生成式AI應用發展規劃(資料來源: 工研院生成式AI規劃小組)
機會與挑戰並行,持續的AI浪潮下的挑戰與機會
AI技術的發展絕不會停留在目前的狀態,藉由生成式AI的點火,未來已有不少應用技術蓄勢待發,包括:
- Hybrid AI:隨著AI愈發普及,愈來愈多的運算將由訓練端邁向推論端,此外,在sLLM模型的推波助瀾下,需要搭配混合邊緣與雲端運算資源,包括AI伺服器、AI工作站、AI終端等各種設備與裝置提高運算效率、擴大應用場景。
- Agentic AI:智慧化的AI Agent將具備更高的自主性,能夠處理複雜任務減少人為干預,並提供個性化的服務體驗,讓Agent可以處理更多的任務,未來將有愈來愈多的日常決策會是由AI Agent來進行。
- Spatial AI:目前LLM主要的應用場景以虛擬場域為主,而VLM、LBM、LWM等模型的發展將讓電腦能在三維世界中進行即時的場景理解、環境感知、行動規劃、以及任務決策。尤其在智慧機器人應用中,Spatial AI將扮演很重要的角色。
圖3 持續演進的AI技術發展方向(資料來源:Gartner、工研院產科國際所整理)
生成式AI的應用雖然是在ChatGPT推出後橫空出世,但相關的技術絕非一蹴可及,而是累積從機器學習、巨量資料、深度學習與FAST AI等諸多演算法、機制、應用與實務經驗堆疊而來的成果。而面對生成式AI仍存在可信任性、高昂的算力與成本等議題,以及國際上AI技術日新月異、國內AI應用快速發展的局面,工研院已經累積深厚的能量,再加上跨領域的實務經驗,持續研發精進,相信將能在國內甚至是全球的AI發展中扮演舉足輕重的角色。