omniture

西浦學(xué)者讓助聽器也能“看得見”

聽覺作為人類感知手段之一,幾十年來(lái)一直是不少研究人員的重點(diǎn)領(lǐng)域。西交利物浦大學(xué)計(jì)算機(jī)科學(xué)和軟件工程系的 Andrew Abel 博士和他的團(tuán)隊(duì)設(shè)計(jì)了一個(gè)新系統(tǒng),他們?cè)谥犉髦屑尤肓瞬蹲饺苏f(shuō)話時(shí)唇形特征的視覺信號(hào),以提高助聽器的使用效果。

蘇州2018年12月12日電 /美通社/ -- 聽覺作為人類感知手段之一,幾十年來(lái)一直是不少研究人員的重點(diǎn)領(lǐng)域。西交利物浦大學(xué)計(jì)算機(jī)科學(xué)和軟件工程系的 Andrew Abel 博士和他的團(tuán)隊(duì)設(shè)計(jì)了一個(gè)新系統(tǒng),他們?cè)谥犉髦屑尤肓瞬蹲饺苏f(shuō)話時(shí)唇形特征的視覺信號(hào),以提高助聽器的使用效果。他們的最新研究成果也在2018年IEEE計(jì)算智能研討會(huì)(IEEE-SSCI 2018)上進(jìn)行發(fā)表。

Abel博士介紹說(shuō),很多傳統(tǒng)的助聽器都是通過(guò)放大患者接收不到的聲音頻率來(lái)達(dá)到助聽效果;有些助聽器內(nèi)安置了除噪音的算法,能夠降低對(duì)話之外的聲音音量;還有一些帶有定向麥克風(fēng),能夠探測(cè)到來(lái)自某些特定方向的聲音。

“但是人們聊天的時(shí)候不僅僅是靠聲音來(lái)交流的?!盇bel博士說(shuō),“人們還會(huì)相互觀察面部表情、肢體語(yǔ)言,而且或多或少都會(huì)觀察對(duì)方的唇部動(dòng)作。”

比如,當(dāng)人們聽到“ba”這個(gè)音節(jié),但是看到的是“fa”這個(gè)音節(jié)的唇部動(dòng)作,人們就會(huì)誤以為自己聽到的是“fa”甚至是“va”。

“這被稱為‘麥格克效應(yīng)’。” Abel博士解釋說(shuō),“大腦在同時(shí)接收到一個(gè)視覺信息和一個(gè)聽覺信息的時(shí)候,有可能視覺信息會(huì)覆蓋掉聽覺信息并造成視聽幻覺?!?/p>

這種現(xiàn)象充分展示了視覺信息在談話中的重要性。因此Abel博士和他的團(tuán)隊(duì)一直在思考:如何才能開發(fā)出接收聲音以外信息的機(jī)器?如何讓這些機(jī)器像人類一樣去“聽”?

Abel博士在就職于蘇格蘭斯特靈大學(xué)時(shí)和Amir Hussain教授一起研究過(guò)助聽科技,他們嘗試把一個(gè)可穿戴的小型照相機(jī)連接到助聽器上,讓系統(tǒng)同時(shí)處理接收到的聽覺和視覺信息。在這些視覺信息中,會(huì)影響系統(tǒng)處理結(jié)果的是唇部動(dòng)作、嘴巴張開或閉合、寬度及深度等唇形特征。

受到之前研究的啟發(fā),Abel博士、西浦計(jì)算機(jī)系畢業(yè)生高成翔以及斯特靈大學(xué)研究人員聯(lián)合開發(fā)了一個(gè)新系統(tǒng),專門記錄唇形特征信息并建立唇部的3D模型。

西交利物浦大學(xué)研究人員開發(fā)的嘴部動(dòng)作捕捉方法
西交利物浦大學(xué)研究人員開發(fā)的嘴部動(dòng)作捕捉方法

“這個(gè)3D模型可以用來(lái)確定說(shuō)話時(shí)的音量和音調(diào)特征,這些特征有利于提高助聽器的降噪功能,也能運(yùn)用于我們?cè)谘芯康拇秸Z(yǔ)讀取。” Abel博士補(bǔ)充說(shuō)。

他正在指導(dǎo)一項(xiàng)將唇讀科技運(yùn)用于對(duì)外漢語(yǔ)教學(xué)的畢業(yè)設(shè)計(jì),只要系統(tǒng)接收到正確的視覺和聽覺信號(hào)就可以區(qū)分不同的中文發(fā)音,這些信息會(huì)自動(dòng)反饋給學(xué)習(xí)漢語(yǔ)的人。

“中文是一種聲調(diào)語(yǔ)言,發(fā)音和其他語(yǔ)言不太一樣,學(xué)好正確發(fā)音是有一定難度的?!?/p>

Abel博士研究的另一個(gè)領(lǐng)域是利用圖像識(shí)別技術(shù)來(lái)改善助聽器過(guò)濾噪音的效果。例如,攝像機(jī)可以識(shí)別出用戶所處的環(huán)境是安靜的辦公室還是喧鬧的酒吧,根據(jù)環(huán)境的不同可以采取不同的噪音過(guò)濾方法。

“在大腦處理聲音的時(shí)候,感知效應(yīng)是非常重要的一部分?!盇bel博士說(shuō)。

比如人們會(huì)根據(jù)環(huán)境聲音的大小來(lái)調(diào)整自己的說(shuō)話聲音,這被稱為“倫巴效應(yīng)”。此外,聽力正常的人在嘈雜的環(huán)境中也可以進(jìn)行高效溝通,這是因?yàn)榇竽X自動(dòng)忽略掉了其他人的說(shuō)話聲音以及無(wú)關(guān)的環(huán)境音,這被稱為“雞尾酒會(huì)效應(yīng)”。

“目前我們無(wú)法將所有視覺信息整合到助聽器中,但是我們正在朝著‘感知型助聽器’這個(gè)方向努力。”

Abel博士和他的同事希望能夠?qū)⒃~語(yǔ)識(shí)別和預(yù)判對(duì)話結(jié)合,同時(shí)整合環(huán)境識(shí)別及其他視覺信息處理手段,有一天能創(chuàng)造出能夠像人一樣“思考”的改進(jìn)型助聽器。

 “在我們理解并復(fù)制人耳處理聲音的過(guò)程時(shí),我們不僅能改良助聽器科技,還學(xué)到了很多關(guān)于人類自身及人腦思維運(yùn)作方式的知識(shí)?!彼f(shuō)。

閱讀原文請(qǐng)?jiān)L問(wèn):https://www.xjtlu.edu.cn/zh/news/2018/12/xipuxuezheyanjiuxinxingzhutingqi 

消息來(lái)源:西交利物浦大學(xué)
China-PRNewsire-300-300.png
美通說(shuō)傳播
美通社專注企業(yè)傳播,為您分享全球范圍內(nèi)市場(chǎng)公關(guān)、品牌營(yíng)銷、企業(yè)傳播領(lǐng)域的最新趨勢(shì)、動(dòng)態(tài),介紹相關(guān)知識(shí)、經(jīng)驗(yàn)、技巧、案例和工具。
關(guān)鍵詞: 教育 高端教育
collection