不明觉厉 脸书“Rosetta”系统能从图片读取文字

加拿大都市网

■脸书开发“Rosetta”机械学习系统,辨认图像里的文字。脸书

星岛日报讯

据网站Engadget报道,网民沟通并不只限文字,还有用上图像。对于脸书(Facebook)这些每月有超过20亿活跃用户的平台而言,每日有海量的图像上载,当中包括了表情包(meme)。为要让内含文字的图像在相关的相片搜寻出现,或让读者可以看到图像里写上的是什么并确保它们没有包含仇视言论或其他有违网站内容政策的字句,脸书已建立起并推出一个名为“Rosetta”的大规模机械学习系统。

脸书需要一个能够不断处理大量内容的光学字符识别(OCR)系统,因此有必要自行开发本身的技术。据脸书表示,Rosetta每日实时从超过十亿的图像和视频画面中,取出各种不同语言的文字。

脸书在一则博客帖子中解释Rosetta如何运作:它首先是从图像里检测有可能内含文字的长方格位置。之后利用一项“卷积神经网络”(Convolutional Neural Network)来辨认及抄写这范围里的文字,即使是阿拉伯语或北印度语等并非英语或拉丁字母也可以。

为训练这系统,脸书动用了人类和机械加注标签的公共图像。

在脸书和Instagram的各支团队,已在使用Rosetta来找寻更多内容并为平台把关。脸书计划把系统能够辨认的语文种类继续扩大,并要提升它在视频画面读取文字的能力。

提到语言,脸书已为它的自动翻译服务增设24种语言:包括塞尔维亚语、白俄罗斯语、马拉地语、锡兰语、泰卢固语、尼泊尔语、坎那达语、乌都语、旁遮普语、柬埔寨语、帕施图语、蒙古语、祖鲁语、科萨语以及索马利语。

脸书承认这些语言的翻译只是初阶,因此内里仍有大量错误。但脸书计划要继续改进并在日后包括更多语言。

share to wechat

延伸阅读

share to wechat

延伸阅读

share to wechat

加拿大住宅建筑投资 九个月来首次出现下降

IKEA夏日减价特卖开始 部分商品折扣高达50%

爱马仕售16.5万人民币单车 内地上架旋即售罄

金融市场综合:美国通胀数字好 北美市场广泛反弹