生成式AI的崛起：必須了解的定義及運作方式

2023 / 06 / 30
作者：國際瞭望

2023 / 06 / 30
Author : 國際瞭望

分類：技術, 發展, 社群
Tags： AI, 國際瞭望, 專題文章, 深度學習, 生成式AI

Categories : 技術, 發展, 社群
Tags : AI, 國際瞭望, 專題文章, 深度學習, 生成式AI

蔡昱宏/東海大學資訊管理學系

生成式AI的定義與原理

生成式AI (Generative AI)，即人工智慧生成內容，又稱AIGC（AI Generated Content）。生成式AI是人工智慧中的一個分支，主要應用於創造性的工作，例如文章生成、影像生成、音樂生成等。現下討論最夯的ChatGPT、Midjourney、Stable Diffusion，以及Office 365 Copilot都是生成式AI的最佳應用^[1]。

生成式AI是通過學習大量的數據，從而可以生成與原始數據相似的新數據。它主要依賴於深度學習技術，其中最常見的是生成對抗網路（Generative Adversarial Network，GAN）、長短期記憶網路、Transformer模型^[2]。

生成式AI的應用

自然語言生成（NLG）：

生成式AI可以用來創建自然語言文本，例如新聞報導、產品描述、評論甚至長篇的論文等。NLG也常會和其他AI應用或技術混合，形成更為複雜且完善的功能或應用。如：Siri、Google助理等，皆是透過STT （Speech-to-Text）語音轉文字和TTS（Text-to-Speech）文字轉語音輔以關鍵字搜索、資料庫、深度學習(Deep Learning，DL)等技術形成，其中STT和TTS便是以NLG為基礎所實現。這些應用通常需要使用大量的訓練數據和強大的語言模型，例如GPT-3。

圖像及影片生成：

生成式AI可以創建逼真的圖像及影片，例如人像、風景、新聞等。這些應用通常需要使用生成對抗網路技術來生成真實的圖像。

GAN由兩個網路構成，分別是鑑別網路（Discriminating Network）與生成網路（Generative Network），透過兩者相互對抗產生結果是其深度學習的運作原理。生成網路不斷生成結果，再由鑑別網路針對此結果進行評比。生成網路則會參考鑑別網路產生的評比，去修改生成的函數，進而生成更佳的結果。不斷地生成與對抗使得成果每次都優於前一次，正是GAN的核心所在^[3]。

對話生成：

生成式AI可以用來生成對話文本，例如聊天機器人、客戶服務等。這些應用需要使用大量訓練數據和自然語言處理（Natural Language Processing，NLP）技術來生成流暢、自然的對話。

生成式AI的優缺點

生成式AI主要依賴於深度學習(DL)的技術才得以實現，因此探討生成式AI的優缺點，可以從深度學習的層面進行剖析，首先談談優點:

自動生成:

生成式AI可以自動生成，不需要人類的干預，因此可以大大減少人類的時間和精力。自動生成可以大幅縮短如文案撰寫、新聞稿等簡單卻費時的工作時間。

資料生成：

由於生成式AI可以生成新的資訊，因此它可以用以產生訓練用的資料。深度學習的難點之一便是需要大量的資料進行訓練，特定類別資料的收集因本身的稀缺性，收集更是困難。而資料生成便是解決此問題的方法之一。

當然，有利便有弊，即便生成式AI有著不少的優點，卻也難以避免其使用上的限制及缺點:

難以解釋性:

生成式AI仰賴的是深度學習的技術，而深度學習是由多層的神經網路架構組成，其演算的變數及函數組合數量之龐大，遠非人腦可以計算理解。因此，生成的結果與過程是人腦難以理解並解釋的。

高成本:

生成式AI是藉由深度學習才能達成的技術，而深度學習本身需要透過大量的計算及訓練資料才能實現。期訓練過程在計算上有著硬體設備、電力等高額成本存在，而訓練的資料更是需要大量收集及人工標記，同樣需要高額成本。

生成資料的真實性:

生成式AI所產生的資料有著一致命的缺陷，那就是資料的真實性。除去影音、語音，在文章、評論等文字類型的生成結果，其真實性皆需要使用者去驗證判斷。因為生成式AI是透過訓練既往的資料所產生的模型，其生成的資料雖然參考了過去訓練的資料，卻仍可能生成出過去未曾出現的資料。因此經常會有參雜假資訊的情況發生。

生成式AI面臨的挑戰

近年來生成式AI的快速發展，各式各樣的應用接連推出，也為各行各業帶來了不小的衝擊。因為生成式AI可以快速產出文案、影音等能力，加速了各行各業的生產力，也改變了部分職業的工作方式及內容。而當前的生成式卻也面臨了不少的挑戰:

資料真實性:

若以工作上的生產力而言，生成式AI確實可以大幅度縮短生產的時間，可是其生成的內容真實性卻是一大隱憂。生成的內容經常會參雜假資訊，因此若是作為工作生產用，則需要使用者自行驗證內容的真實性。

版權爭議^[4]：

現在有很多人在藝術創作的領域使用生成式AI，同時也引發了不小的議題。因為AI在訓練過程中需要大量的訓練資料，而這些來自創作者的作品自然而然會被用於訓練上，這就涉及了著作權的問題。然而，使用此生成式AI進行的創作，其著作權的歸屬目前仍然是一大問題。未來制定法規則甚至會影響相關的技術研發。

雖然生成式AI帶來了極高的生產力，卻也衍生的不少的問題，而這些問題都是當前必須面對的。在生成式AI蓬勃發展的同時，法規的制定與技術的應用也應隨著生成式AI的腳步前進。未來如何使生成式AI所生成的資料符合道德與法律的規範，以及發展新技術解決當前資料真實性及不可解釋性等問題，才能發揮生成式AI最大的價值。

本文內容純屬筆者個人意見，並不代表TWNIC立場

參考資料

^[1] Best Network Company(2023).什麼是生成式AI？5分鐘帶你了解生成式人工智慧.

檢自:https://www.ibest.com.tw/news-detail/aigc/(Mar.24.2023)

^[2] 同上

^[3] HiSKIO(2019).生成對抗網路到底在GAN.麻?檢自:https://medium.com/@hiskio/%E7%94%9F%E6%88%90%E5%B0%8D%E6%8A%97%E7%B6%B2%E8%B7%AF%E5%88%B0%E5%BA%95%E5%9C%A8gan%E9%BA%BB-f149efb9eb6b(April.1.2019)

^[4] 曹晏郡邱福財薛宜家陳昌維(2023). 生成式AI搶進藝術領域引發著作權爭議.

檢自https://news.pts.org.tw/article/632136(April.13.2023)