生成式AI的崛起:必須了解的定義及運作方式

蔡昱宏/東海大學資訊管理學系

生成式AI的定義與原理

生成式AI (Generative AI),即人工智慧生成內容,又稱AIGC(AI Generated Content)。生成式AI是人工智慧中的一個分支,主要應用於創造性的工作,例如文章生成、影像生成、音樂生成等。現下討論最夯的ChatGPT、Midjourney、Stable Diffusion,以及Office 365 Copilot都是生成式AI的最佳應用[1]

生成式AI是通過學習大量的數據,從而可以生成與原始數據相似的新數據。它主要依賴於深度學習技術,其中最常見的是生成對抗網路(Generative Adversarial Network,GAN)、長短期記憶網路、Transformer模型[2]

生成式AI的應用

  1. 自然語言生成(NLG):

生成式AI可以用來創建自然語言文本,例如新聞報導、產品描述、評論甚至長篇的論文等。NLG也常會和其他AI應用或技術混合,形成更為複雜且完善的功能或應用。如:Siri、Google助理等,皆是透過STT (Speech-to-Text)語音轉文字和TTS(Text-to-Speech)文字轉語音輔以關鍵字搜索、資料庫、深度學習(Deep Learning,DL)等技術形成,其中STT和TTS便是以NLG為基礎所實現。這些應用通常需要使用大量的訓練數據和強大的語言模型,例如GPT-3。

  1. 圖像及影片生成:

生成式AI可以創建逼真的圖像及影片,例如人像、風景、新聞等。這些應用通常需要使用生成對抗網路技術來生成真實的圖像。

GAN由兩個網路構成,分別是鑑別網路(Discriminating Network)與生成網路(Generative Network),透過兩者相互對抗產生結果是其深度學習的運作原理。生成網路不斷生成結果,再由鑑別網路針對此結果進行評比。生成網路則會參考鑑別網路產生的評比,去修改生成的函數,進而生成更佳的結果。不斷地生成與對抗使得成果每次都優於前一次,正是GAN的核心所在[3]

  1. 對話生成:

生成式AI可以用來生成對話文本,例如聊天機器人、客戶服務等。這些應用需要使用大量訓練數據和自然語言處理(Natural Language Processing,NLP)技術來生成流暢、自然的對話。

生成式AI的優缺點

生成式AI主要依賴於深度學習(DL)的技術才得以實現,因此探討生成式AI的優缺點,可以從深度學習的層面進行剖析,首先談談優點:

  1. 自動生成:

生成式AI可以自動生成,不需要人類的干預,因此可以大大減少人類的時間和精力。自動生成可以大幅縮短如文案撰寫、新聞稿等簡單卻費時的工作時間。

  1. 資料生成:

由於生成式AI可以生成新的資訊,因此它可以用以產生訓練用的資料。深度學習的難點之一便是需要大量的資料進行訓練,特定類別資料的收集因本身的稀缺性,收集更是困難。而資料生成便是解決此問題的方法之一。

當然,有利便有弊,即便生成式AI有著不少的優點,卻也難以避免其使用上的限制及缺點:

  1. 難以解釋性:

生成式AI仰賴的是深度學習的技術,而深度學習是由多層的神經網路架構組成,其演算的變數及函數組合數量之龐大,遠非人腦可以計算理解。因此,生成的結果與過程是人腦難以理解並解釋的。

  1. 高成本:

生成式AI是藉由深度學習才能達成的技術,而深度學習本身需要透過大量的計算及訓練資料才能實現。期訓練過程在計算上有著硬體設備、電力等高額成本存在,而訓練的資料更是需要大量收集及人工標記,同樣需要高額成本。

  1. 生成資料的真實性:

生成式AI所產生的資料有著一致命的缺陷,那就是資料的真實性。除去影音、語音,在文章、評論等文字類型的生成結果,其真實性皆需要使用者去驗證判斷。因為生成式AI是透過訓練既往的資料所產生的模型,其生成的資料雖然參考了過去訓練的資料,卻仍可能生成出過去未曾出現的資料。因此經常會有參雜假資訊的情況發生。

生成式AI面臨的挑戰

近年來生成式AI的快速發展,各式各樣的應用接連推出,也為各行各業帶來了不小的衝擊。因為生成式AI可以快速產出文案、影音等能力,加速了各行各業的生產力,也改變了部分職業的工作方式及內容。而當前的生成式卻也面臨了不少的挑戰:

  1. 資料真實性:

若以工作上的生產力而言,生成式AI確實可以大幅度縮短生產的時間,可是其生成的內容真實性卻是一大隱憂。生成的內容經常會參雜假資訊,因此若是作為工作生產用,則需要使用者自行驗證內容的真實性。

  1. 版權爭議[4]

現在有很多人在藝術創作的領域使用生成式AI,同時也引發了不小的議題。因為AI在訓練過程中需要大量的訓練資料,而這些來自創作者的作品自然而然會被用於訓練上,這就涉及了著作權的問題。然而,使用此生成式AI進行的創作,其著作權的歸屬目前仍然是一大問題。未來制定法規則甚至會影響相關的技術研發。

雖然生成式AI帶來了極高的生產力,卻也衍生的不少的問題,而這些問題都是當前必須面對的。在生成式AI蓬勃發展的同時,法規的制定與技術的應用也應隨著生成式AI的腳步前進。未來如何使生成式AI所生成的資料符合道德與法律的規範,以及發展新技術解決當前資料真實性及不可解釋性等問題,才能發揮生成式AI最大的價值。

本文內容純屬筆者個人意見,並不代表TWNIC立場

參考資料

[1] Best Network Company(2023).什麼是生成式AI?5分鐘帶你了解生成式人工智慧.

檢自:https://www.ibest.com.tw/news-detail/aigc/(Mar.24.2023)

[2] 同上

[3] HiSKIO(2019).生成對抗網路到底在GAN.麻?檢自:https://medium.com/@hiskio/%E7%94%9F%E6%88%90%E5%B0%8D%E6%8A%97%E7%B6%B2%E8%B7%AF%E5%88%B0%E5%BA%95%E5%9C%A8gan%E9%BA%BB-f149efb9eb6b(April.1.2019)

[4] 曹晏郡 邱福財 薛宜家 陳昌維(2023). 生成式AI搶進藝術領域 引發著作權爭議.

檢自https://news.pts.org.tw/article/632136(April.13.2023)

Scroll to Top