人工智慧可以根據聲音判斷你正在輸入什麼

英國達勒姆(Durham)大學、薩里(Surrey)大學和倫敦皇家霍洛威大學(Royal Holloway University of London)的研究人員最近發表的一篇論文,該論文是與IEEE Xplore合作的獨家IEEE Journal Watch系列的一部分。

研究指出,根據使用者在鍵盤上敲擊按鍵的聲音,輸入的訊息可以被解碼。研究人員訓練了兩個機器學習模型來識別蘋果筆記型電腦鍵盤上每個按鍵的獨特點擊聲,並使用來自兩個來源的聲音進行訓練:鍵盤附近放置的智慧型手機和通過Zoom進行的視訊通話。他們報告了智慧型手機聲音模型具有95%的準確度,Zoom通話模型則是93%的準確度。

這些模型可能使聲學旁道攻擊成為可能。儘管本文介紹的技術依賴於當代機器學習技術,但這種攻擊至少可以追溯到20世紀50年代,當時英國情報機構秘密記錄了埃及政府使用的機械加密設備。

電腦的聲學旁道攻擊通過音頻錄音估算使用電腦的人按下了哪些鍵以及按下的順序,這可能洩露用戶的敏感資訊,如銀行PIN、帳戶密碼或政府憑證。

該團隊的模型是基於卷積神經網路(Convolutional Neural Network,CNN)構建的,就像CNN可以識別人群中的面孔一樣,它們也可以識別聲音訊號圖表中的模式。該程式隔離每次按鍵的聲音,將其波形轉換為頻譜圖,從中提取每次點擊的頻率模式,並計算按下特定按鍵的相對機率。

然而,需要注意的是,本文介紹的攻擊範圍有限。這兩個聲音解碼模型是基於同一用戶在同一台電腦上的資料進行訓練和評估的,並需要標記的訓練資料。因此,如果在不同聲音環境和不同用戶的電腦上使用這種攻擊,其效果如何還有待觀察。然而,在某些情況下,攻擊者仍可以存取使用者已標記的聲音資料,這可能會引發一些隱私和安全問題。

研究團隊提出了幾種減輕這種攻擊風險的方法,包括快速打字和引入噪音或失真輪廓。同時,呼籲網路社群提供更安全和保護隱私的解決方案,以確保用戶能夠安全使用網路。

本文內容純屬筆者個人意見,並不代表TWNIC立場

相關連結: Michal Nolan(2023).This AI Can Tell What You’re Typing Based on the Sound. spectrum.

檢自:https://spectrum.ieee.org/side-channel-attack(AUG 26,2023)

Scroll to Top