跳到主要內容區
:::

東華通識教育大師典範講座:「深度學習及其在電腦視覺的應用」

最後更新日期 : 2024-09-19
SDG指標: SDGs09,SDGs04,SDGs08,SDGs11
通識教育中心黃琡雅主任頒發感謝狀並合影留念
通識教育中心黃琡雅主任頒發感謝狀並合影留念

國立東華大學「113-1通識教育大師典範講座」舉辦本學期第一場講座「深度學習及其在電腦視覺的應用」,榮幸邀請到國立中正大學資訊工程學系柳金章教授蒞臨主講,與大家介紹充斥在我們生活之中的電腦視覺,以及深度學習在AI應用中的巨大潛力。

柳金章教授與東華大學學生分享深度學習
柳金章教授與東華大學學生分享深度學習

柳金章教授首先解釋何謂深度學習(Deep Learning),深度學習是一種讓電腦透過模擬人腦神經元活動來處理資訊的自動學習方式。傳統的機械學習需要人工預先處理資料庫,分類影像、提供影像特點,電腦才能通過數據特徵來辨認不同的物品,十分依賴人工介入。深度學習由於系統結構、模型複雜,因此可以解決更加複雜的問題,只需要輸入大量訓練數據集(Data),系統便會自行統整、分析,若投入足夠多的數據,甚至可以同時輸出多種分類結果,不但節省許多人力與時間,相較傳統方式來說,深度學習的系統反應更加靈活。

但看似方便、智能的深度學習其實也有其缺點,柳教授向大家說明目前使用深度學習的問題-由於整個訓練過程都依賴不間斷進行的流程數據,故中途能更正的空間較小。且隨著訓練數據集的增多,計算訓練系統的價格變得更加昂貴,資金挹注不足也成發展深度學習的重大阻礙,於是小範圍而精準的深度學習模型是現今臺灣學院中研究的主軸。

目前世界上還沒有任何一款AI系統是可以處理所有問題的,在輸入運算前,需要人們自行將問題分門別類(語音、文字、影像、數據分析等)再交由特定的AI系統運算,不同的問題須交給不同的系統架構處理。例如GAN(生成對抗網路 Generative adversarial networks)系統可以辨認一張照片是否被變造過,NLP(自然語言處理 Natural Language Processing)系統則用於語言學習或聊天機器人,兩者功能不同,所需的訓練數據集與計算訓練系統也相差甚遠,因此深度學習是十分多元且應用廣泛的技術。

柳教授係電腦視覺以及影像、視訊處理的權威,而第一個深度學習的應用便是用於影像處理,因此柳教授對本次演講主題,有非常多專業而深入的介紹,同時也將實務上所實際運用的技術傳授給同學。例如介紹如何製作訓練數據集時,柳教授便教導同學一項擴充數據的重要秘訣:將同一張圖片由電腦翻轉、傾斜、轉換顏色等後製過後,所產生出的多樣結果也能作為不同的Data使用。在需要大量訓練數據集的深度學習領域中,是相當實用且減低成本的方式,此方式也運用在教授所製的每一個學習模型當中。

演講最後,柳教授展示目前為止他與學生一同製作的一些深度學習模型,例如:水下影像的增強(色彩校正)、視訊影像去模糊(復原被重複曝光的模糊照片),以及低光視訊增強(讓過暗的影像更清晰、恢復可視性),在影像的修正與回復上具有非常實用的效果,可用於監視器、細節檢視等實務上。柳教授表示,這些成果是傳統機器學習無法達成的技術,只有運用深度學習才可能達到目前的復原效果,也期待未來可實際運用於社會與日常生活;而深度學習已變成比傳統機械學習更加實用的系統,在未來的影響力必定不容小覷。


《➜English Version》

瀏覽數: