不明覺厲 臉書「Rosetta」系統能從圖片讀取文字

加拿大都市网

■臉書開發「Rosetta」機械學習系統,辨認圖像里的文字。臉書

星島日報訊

據網站Engadget報道,網民溝通並不只限文字,還有用上圖像。對於臉書(Facebook)這些每月有超過20億活躍用戶的平台而言,每日有海量的圖像上載,當中包括了表情包(meme)。為要讓內含文字的圖像在相關的相片搜尋出現,或讓讀者可以看到圖像里寫上的是什麼並確保它們沒有包含仇視言論或其他有違網站內容政策的字句,臉書已建立起並推出一個名為「Rosetta」的大規模機械學習系統。

臉書需要一個能夠不斷處理大量內容的光學字符識別(OCR)系統,因此有必要自行開發本身的技術。據臉書表示,Rosetta每日實時從超過十億的圖像和視頻畫面中,取出各種不同語言的文字。

臉書在一則博客帖子中解釋Rosetta如何運作:它首先是從圖像里檢測有可能內含文字的長方格位置。之後利用一項「卷積神經網絡」(Convolutional Neural Network)來辨認及抄寫這範圍里的文字,即使是阿拉伯語或北印度語等並非英語或拉丁字母也可以。

為訓練這系統,臉書動用了人類和機械加註標籤的公共圖像。

在臉書和Instagram的各支團隊,已在使用Rosetta來找尋更多內容並為平台把關。臉書計劃把系統能夠辨認的語文種類繼續擴大,並要提升它在視頻畫面讀取文字的能力。

提到語言,臉書已為它的自動翻譯服務增設24種語言:包括塞爾維亞語、白俄羅斯語、馬拉地語、錫蘭語、泰盧固語、尼泊爾語、坎那達語、烏都語、旁遮普語、柬埔寨語、帕施圖語、蒙古語、祖魯語、科薩語以及索馬利語。

臉書承認這些語言的翻譯只是初階,因此內里仍有大量錯誤。但臉書計劃要繼續改進並在日後包括更多語言。

share to wechat

延伸阅读

延伸阅读

诡异!女子推叔叔到银行办贷款  老人已死去数个小时

明天发放新一笔儿童福利金 下期金额再度上调!

Nanos调查:对联邦政府的愤怒和悲观情绪达6年来最高

三星512GB内存卡 原价64.99打折仅售49.99