AR眼鏡語音轉文字實測!效果像開了彈幕,對話記錄可保存回溯

天空之城 2022/12/25 檢舉 我要評論

AR眼鏡字幕功能效果到底咋樣?

實測來了!

不光語音能實時轉成文字,還能分辨說話人主體,甚至還能把文字記錄都保存好,方便以后回溯。

今年,一家來自英國的一家AR初創公司,大開了個腦洞。

他們把語音轉文字的功能,搬到了AR眼鏡上,讓轉好的文字能快速直接呈現在人們眼前。

主要目的就是為了服務 聽障人群

畢竟在很多情況下,即便有助聽器的幫助,聽障人群還是需要有文字作為參考信息。

而通過AR眼鏡的方式,生成字幕能直接呈現在人們眼前,接收信息能更加方便和迅速。

具體效果如何?往下看~

有種開彈幕的感覺

體驗的效果大概如下左圖所示,會有一個對話框,里面將標注說話者及對應語音內容。

體驗者西蒙·希利(Simon·Hill)說,在剛戴上AR眼鏡聽對方說話時,它的文字轉錄準確率非常不錯。

效果有點像平常用語音實時轉文字的功能,在語音結束前,文本內容會一直有調整,最后等一段話說完,才會有個最終版本。

不過在對話情景下,兩個人多聊一會,語音轉寫的速度會變慢一些。

XRAI內部人士表示,這是因為語音轉文字的計算在云端上進行,有延遲很正常。

而且不止是實時轉錄,這個功能還支持搜索歷史記錄,在AR眼鏡端和手機端都能搜,有點聊天軟件那感覺了。

錄下的語音在轉寫完成文字后,就會被立即刪除,XRAI還強調這些文本也是 只有用戶自己可見

如果沒有AR眼鏡,也能在手機上體驗XRAI的功能。

有網友也戴著眼鏡體驗了一下,表示這個功能在轉語音的速度上還是很快的,而且在AR界面里的呈現也不錯。

缺點是需要選一下要識別的語言種類,在這里她測試的是法語。

除此以外,西蒙大哥在體驗中,也發現了一些小問題。

比如按照XRAI的設想,聽障人士使用這一功能,需要一副AR眼鏡+一款安卓手機。

是的,該應用暫時還不支持iOS系統。

而兩台設備加起來,拿著比較麻煩,尤其是在AR眼鏡重量還沒有降下來的情況下,聽障人士要戴人工耳蝸、還要戴一副AR眼鏡,舒適度肯定不高。

西蒙表示:

我無法想象如何整天帶著他們。

以及語音轉文字的效果,西蒙也提出了一點質疑。他表示,對于聽障人士來說,需要文字作為參考信息的情景,很可能是 比較嘈雜的場所,這對于語音識別的算法提出一定要求。

而他在體驗XRAI這項功能時,公司CMO特意把他領到了比較安靜的環境演示,并坦言在嘈雜環境中的效果還不是很好。

以及在價格上,XRAI上線的AR眼鏡是Nreal,國內售價2299元起,海外售價為379美元。

XRAI的服務也并不完全免費,基礎免費版只能保存1天的對話記錄,另外還有20美元/月、50美元/月兩種套餐可以選擇。

如果選擇50美元/月的套餐,在基礎功能上還將加一個人工智能助手。

但西蒙表示,作為一個還在起步階段的產品,有缺點可以理解。

更關鍵的是,他們從無障礙的角度出發想要幫助聽障人群,這一想法還是令人感到欣慰。

背后公司XRAI Glass

提供這項服務的公司來自英國,名叫XRAI Glass。

公司CEO為丹·斯卡夫(Dan Scarfe),他曾在高知特微軟業務組(Cognizant Microsoft Business Group)擔任首席問題官。

CTO蒂姆·斯卡夫(Tim Scarfe),獲得了機器學習專業博士學位,也曾在微軟工作。

按照領英顯示,該公司在今年7月才剛剛成立。

合作的AR眼鏡廠商Nreal于2017年成立,創始人徐馳曾在Magic Leap工作過。

參考鏈接:[1]https://www.wired.com/story/xrai-glass-caption-ar-glasses-first-look/[2]https://www.auganix.org/xrai-glass-launches-its-real-time-augmented-reality-closed-captioning-app-to-users-globally

搶先看最新趣聞請贊下面專頁
用戶評論