東華通識教育大師典範講座:「生成式AI的相關應用」

國立東華大學「112-2通識教育大師典範講座」於5月27日舉辦本學期第11場講座「生成式AI的相關應用」,榮幸邀請到國立臺灣師範大學電機工程學系葉家宏特聘教授主講,為大家說明生成式AI的發展歷程,與目前可見的相關應用。
人工智慧自1957年開始展開,期間也經歷兩次低潮期,但網路的精進仍舊使得人工智慧投入進市場發展,像是1997年IBM Deep Blue戰勝了西洋棋世界冠軍。2013年ILSVRC競賽ZFnet的分類錯誤率下降至11.2%,自此之後每年皆穩定下降。2017年Alpha Go擊敗了世界排名第一的中國旗手柯潔。生成式AI就像是第四次革命,也是目前發展的趨勢,過去希望可以用電腦模擬人類的思考並做出決策,但自2022突破了圖靈測試之後,大部分的產品已經很難分清是電腦還是人類的回答。AI的應用是全世界供應鏈重要的角色,臺灣從2016年起就一直推動AI的應用,也不斷思索如何將AI導入進產業內並發展。
深度學習是AI中的一種方法,以人工神經網路為架構,是依照人類大腦運作方式而成的演算法;神經網路則是模仿生物神經網路,只要輸入資料並進行訓練,就可以進行決策的輸出。過去的神經網路架構很簡單,只有兩層三層,但在深度學習範疇內,需要將網路的深度加深,甚至可以達到好幾百層,好的架構可以延遲梯度消失的早期發生,深度學習最重要的就是運用既有的資料進行推理,並提出建議或調整,做出更為精確的決策。
葉教授表示,自2020開始ChatGPT僅花費五天就達到百萬用戶,兩個月就突破了1億使用者,是史上成長最快的消費應用程式,但以泛用式的AI來講,最開始即便百家爭鳴,到最後也只會剩下一兩家,因為AI的運用需要服務創新,同時也需要成功的商業模式去驅動。GPT3的訓練參數非常大,而GPT4則達到了100trillion,目前已發展到GPT-4o,以前溝通時的延遲是2.8秒,但現在延遲時間已經縮短至320毫秒之內,這樣子發展快速的生成式AI正在迅速改變我們的生活,提供了高效工具、個性化娛樂和科學研究的突破,創造新的世界。
很久以前就希望可以運用人工智慧進行文本生成,知名例子像是中國推出的一款AI聊天機器人小冰,除了進行聊天之外還可以生成詩文。而除了輸出文字之外,能夠輸出圖片,像是運用RNN生成的小說線上書店,不論是小說封面或小說內容都是由AI生成。現今已經可以做到將文字轉成視訊,自2021年開始就有投入製作,但是非常困難,因此SORA的推出造成了許多的轟動,以前是以圖或文字轉成視訊,生成出的結果只有幾秒鐘,但SORA經過大規模的訓練,可以模擬物理世界當中人類和動物、環境的互動狀況,可謂是革命性的產生。
葉教授也介紹可以編輯視訊的系統,像是Runway基於擴散模型提出的編輯系統Gen-1,可以根據文字進行影片中的項目編輯,而Gen-2則可以直接根據影片進行編輯,電影《媽的多重宇宙》也使用了Gen-2製作特效畫面,可以看見人工智慧也慢慢導入進電影產業,擁有蠻大的市場。
而針對AI是否會取代人類的工作,葉教授表示想要完全取代是不可能的。以藝術行業來說,有不少的設計或比賽禁止使用AI,一百年前電影技術剛出來時也沒有辦法被很好地接受,但是這些技術地加入可以讓產業的發展更蓬勃,尤其這些工具的資料庫也是由人類撰寫出來的。AI沒有辦法完全替代人腦,因此該做的其實是學習如何善用這些工具,例如即時翻譯系統的出現,目的是為了增加工作效率,而相應的,在這樣的情況下也會創造出一些工作機會。