TAIPEI ASSOCIATION OF ADVERTISING AGENCIES台北市廣告代理商業同業公會

雲端讀光技術 讓視障者也能網路購物

2020-11-16

為了讓視障人士能夠「閱讀」世界及參與數位經濟發展,阿里巴巴旗下的達摩研究院研發出「讀光」技術,也就是所謂的光學字符識別(Optical Character Recognitio,OCR),將光學與運算技術結合,對文本資料的圖像文件進行分析識別處理,獲取文字及版面資訊,讓視障者也能藉此享受科技便利。

簡而言之,讀光是將圖片資訊化為語音,讓視障者用耳朵「讀取」資訊。OCR 技術最初用於印刷體文字辨識,例如郵政系統的郵編數字識別,以實現郵件自動分揀功能。但隨著光學設備(如掃描儀器、數位相機及手機等)的飛速發展, OCR 應用領域日益廣泛,包含車牌識別、證件識別、票據識別等眾多場景。

阿里巴巴指出,雖然目前新款智慧型手機一般具備朗讀功能,不過,圖片資訊目前並不能被識別出來,而達摩院的 OCR 技術則改善了此一情況。像是讓淘寶具備了自動識別圖片的能力;在 2018 年,淘寶天貓正式推出「聽圖購物」的程序,將「讀光」應用至購物體驗之中,能夠精準地把圖片中的資訊轉為語音,讓視障用戶能夠靠聽力購物。

達摩院資深算法專家、阿里巴巴 OCR 技術負責人王永攀表示,阿里巴巴的技術團隊從 2010 年就開始致力於解決圖像中的文字問題,只要使用者打開(手機)旁白功能,OCR 就會在這些應用程式裡面,自動啟動讀光 OCR 功能;且讀光的閱讀速度非常的快,對視障人士而言非常流暢。


(資料來源:宏將週報
【本訊息文字圖片未經原提供單位許可,不得任意轉載及連結,如有需求,請洽原資料提供單位。】