圖靈測試成為過去式,新型智慧測試興起

圖靈測試最初被圖靈自稱為「模仿遊戲」。2014年,一個偽裝成烏克蘭少年Eugene Goostman的聊天機器人成功地通過圖靈測試,欺騙了超過三分之一的人,使他們誤以為正在與另一個人類對話,各路研究人員與專家對這個聊天機器人是否通過測試提出質疑。

如今,我們生活周遭看似具有智慧的裝置隨處可見。例如智慧型喇叭會在我們離開家門時提醒我們帶傘,而像ChatGPT這樣的大型語言模型則能夠撰寫比擬人類的電子郵件。與人類相比,這些機器可能很容易讓人混淆,這似乎意味著圖靈測試已經失去其重要性。

在2023年11月10日發表的《Intelligent Computing》期刊論文中,兩位研究人員,普林斯頓大學心理學教授Philip Johnson-Laird和德國Chemnitz科技大學預測分析教授Marco Ragni提出了一種新型智慧測試。他們將機器視為心理研究的參與者,目的在確定它們的推理能力與人類的相似程度。

論文中,Johnson-Laird和Ragni主張圖靈測試一開始就不是衡量機器智慧的好方法,因為它未能涉及人類思維的過程。

牛津大學未來人類研究所的高級研究員Anders Sandberg,表示同意這一觀點,但是他對依靠判斷推理能力是否與人類相近,來評估是否具有人類智慧的最終測試仍保持懷疑態度。

即使圖靈測試可能正在逐漸退出舞台,英國考文垂大學(Coventry University)的助理教授Huma Shah表示這並不一定意味著它們不再有用。就無法區分性而言,圖靈測試仍然具有價值。我們可以將這種無法區分性概念應用於其他領域,例如,在臉部識別方面或確保安全駕駛的情境中,以避免對乘客和行人造成傷害。

在這些領域中,使用者期望機器的表現能夠超越或至少與人類執行任務的效率和道德水平相當。

本文內容純屬筆者個人意見,並不代表TWNIC立場

相關連結:

SARAH WELLS(2023). Is the Turing Test Dead? https://spectrum.ieee.org/turing-test (Nov. 30, 2023)

天下文化(2015). 是人?還是機器?圖靈的模仿遊戲-《創新者們》檢自https://pansci.asia/archives/85570 (Sep. 20, 2015)

郭和杰(2014). 電腦首次通過圖靈測試,人工智慧大突破?檢自https://www.ithome.com.tw/news/88507 (Jun. 10, 2014)

Scroll to Top