里程碑!AI將人類思想活動轉成文字

加拿大都市网

在AI領域,或許我們馬上就能達成一項令人印象深刻且難以置信的里程碑成就——使得我們在語音識別方向上的取得豐碩成果現在就如同小孩子的遊戲:人工智能(AI)系統可以直接將我們的大腦活動轉化為完整的文本信息。

這不是科幻小說的劇情。從動物模型到人類參與者,腦機接口在過去的幾十年中得到了長足進展,實際上已經能看到勝利的曙光。

加州大學舊金山分校張氏實驗室的神經外科醫生愛德華·張領導的團隊使用一種新方法來解碼腦皮層的電活動:由植入大腦的電極採集皮層活動期間發生的電脈衝。

有4名癲癇患者在腦部安裝了用於監測癲癇癥狀的植入物,UCSF團隊藉此機會進行了一項輔助實驗:讓參與者大聲朗讀並重複句子,用電極記錄他們的大腦活動。

然後,將這些數據輸入到神經網絡中,該網絡會根據實驗的音頻記錄來分析與某些語音簽名(例如元音,輔音或嘴巴動作)相對應的大腦活動模式。

此後,另一個神經網絡解碼了語義的表達形式(從重複的30–50個口頭句子收集而來),並僅基於單詞的皮層簽名來預測所說的內容。

在最佳狀態下,該系統可以提供足夠低的誤碼率(WER),其中只有3%腦信號被錯誤轉譯。

錯誤的例子包括:「博物館每天晚上都會聘請音樂家」,預測為「博物館每個昂貴的早上都會聘請音樂家」; 「蛋糕的一部分被狗吃掉了」被預測為「蛋糕的一部分是餅乾」;和「蒂娜·特納是流行歌手」變成了「#¥·特納是流行歌手」。

在最不準確的情況下,錯誤翻譯在語義上或語音上都與原文毫無關係:「她穿着溫暖的羊毛工作服」被解釋為「綠洲是海市蜃樓」。

儘管如此,儘管存在着明顯的錯誤,總體而言,該系統仍可構成基於AI的腦活動解碼的新基準,並且其最佳狀態與專業的人類語音轉錄系統相當。

當然,與通常的人類語音語言打交道的專業語言轉文字軟件必須能夠處理成千上萬個單詞。相比之下,AI腦接口系統目前只有有限的大約250個特定單詞的皮質簽名。

儘管還有許多障礙,但研究團隊認為,該系統有一天可以幫助喪失語言能力的人說話或者讓失去肢體的人單純利用意念操作假肢。如果有可能做到這一點,那將是一件了不起的成就——遠遠超出了理論科學的範疇。

作者解釋說:「在長期攜帶植入物的參與者中,可用的訓練數據量將比本研究中使用的語音語素大幾個數量級,AI的詞彙量和靈活性可被極大地擴展。」

論文發表在《自然·神經科學》上。(煎蛋,圖片來源pixabay)

share to wechat

延伸阅读

延伸阅读

61岁中国男韩国种牙手术后当晚去世 下颌骨粉碎骨折

双拉链时尚女士腰包 打折只售15.90

受够了!加拿大中产纷纷逃往佛罗里达州

安省女子机智应对新型骗局 Costco账户下单差点被刷近$5千!