在Facebook和其他社交媒體平臺上最常見的分享內容之一是照片。雖然大多數社交媒體用戶都能看懂一張圖片,并了解它所代表的內容,但對于那些盲人或視障人士來說就不那么容易了。Facebook表示,屏幕閱讀器可以使用合成語音描述這些圖片的內容,讓盲人或視障用戶能夠理解Facebook feed中的圖片。
然而,許多照片在發布時沒有alt文字,導致Facebook在2016年推出了自動替代文本(AAT)。該技術利用對象識別技術為盲人或視障用戶按需生成照片的描述。自2016年以來,Facebook一直致力于改進AAT,并在最近推出了下一代技術。Facebook在AAT上的進步改善了用戶的照片體驗,AAT可以可靠地檢測和識別照片中的概念數量擴大了十倍以上。這意味著沒有描述的照片減少了,提供的描述也更加詳細。AAT可以識別活動、地標、動物類型等等。
AAT現在會給出這樣的描述:“可能是兩個人的自拍,戶外,比薩斜塔”。Facebook還表示,能夠在照片中加入有關元素的潛在位置和相對大小的信息是行業首創。它不是簡單地描述 “可能是五人的合影”,而是描述成“兩個人在照片的中心,另外三個人向邊緣分散。”
Facebook表示,這一進步可以幫助盲人或視力受損的用戶更好地理解家人和朋友發布照片中的內容。最新版本的AAT使用了一個在數十億張Instagram公開圖片和標簽數據上訓練出來的模型。訓練后產生的模型更加準確,并且在文化和人口統計方面更具包容性。改進后的AAT可以可靠地識別1200多個概念。
責編AJX
-
AI
+關注
關注
87文章
33964瀏覽量
274851 -
Facebook
+關注
關注
3文章
1432瀏覽量
56053 -
照片
+關注
關注
0文章
15瀏覽量
9682
發布評論請先 登錄
Gemini Vision + Raspberry Pi 化身“數字導盲犬”?

RDK加持的導盲眼鏡:視障人士的“眼睛外掛”

百度AI手語數字人助力聽障人士“聽見”聲音
海康威視通過IEC 62443-4-1認證

AI賦能銳視測控平臺

Luma AI全新視頻模型Ray 2即將面向消費者、專業人士和開發者開放
使用NVIDIA Jetson打造機器人導盲犬
使用機器學習和NVIDIA Jetson邊緣AI和機器人平臺打造機器人導盲犬
助盲環境感知裝置設計方案

利用圖像處理板避障 讓小型飛行器像昆蟲一樣靈巧

智行者——視聽障礙者出行輔助AI小車設計

強強聯合!深視智能攜手Zebra公司成功舉辦“3D機器視覺+AI融合技術”研討會

評論