首頁 > 資訊 > 聚焦 > 正文

        聽障人士的“人生第一句”

        2023-07-27 20:17:08來源:搜狐

        杭州的馬塍路,2022年夏天開了兩家特殊的店鋪

        ,一家熟客靠小紙條
        、打字溝通的理發(fā)店
        ,一家沒有“歡迎光臨”問候聲的面包店
        。這兩個靠聽障者經營的店鋪格外安靜
        ,但生意卻火熱
        ,街道也因此得到了“無聲街道”的稱呼

        隔了一年的夏天,AIGC技術開始席卷國內外的商業(yè)世界

        ,互聯網公司紛紛投入到新一輪的技術浪潮中
        。AI技術的風也吹到了這條街道。

        今年45歲的聽障理發(fā)師沈師傅難得地撥通了自己母親的電話

        ,通過用自己的音色合成的話
        ,說出了自己對媽媽表示感謝的“人生第一句”。店里的熟客也終于聽到了這位長期為自己理發(fā)的“Tony”的聲音

        先天聽障的甜品師小陳

        ,做出拿手的奶凍和牛角包,總是最快售罄
        。平時發(fā)不出完整聲音的她
        ,也人生第一次跟顧客說了“歡迎光臨。”“甜品需要為您打包嗎?”

        對一部分聽障人士來說

        ,說出完整的句子
        、甚至音節(jié)都是現實的難題
        。普通人輕易可以做到的這件事
        ,對他們卻是時間跨越幾十年后,才終于靠技術得到的一種完全的展現
        。技術讓這種缺憾有了彌補的可能性

        有數據顯示,中國聽力障礙殘疾人數約為2780萬

        。對比來看
        ,聽障專業(yè)服務人士只有約1萬名,助聽器的應用不到5%
        。這意味著
        ,聽障人士需要主動或者被動地減少溝通。

        正是有了網易互娛的聽障人士AI復原原聲的工具

        ,聽障人士只需要上傳2分鐘沒有完整語義的發(fā)聲片段
        ,就能重建出屬于自己獨一無二的聲音
        。之后,只需輸入文字
        ,就可以通過個人音色傳達出來
        。這項新技術的成熟正在漸漸消除聽障人士溝通的困難和情感表達的阻礙。

        被掛掉的電話和“歡迎光臨

        45年來

        ,沈師傅的母親已經習慣了兒子聲音的“缺席”
        。沈師傅因為兒時的一場高燒,失去了聽力
        ,世界的聲音逐漸消失
        。跟異地的妻子聯系時,兩人也只能通過手語交流
        。沈師傅的母親從來沒接到兒子電話
        ,以至于第一次打去電話時,她下意識地選擇了掛斷

        一句屬于沈師傅聲線合成的“媽媽

        ,謝謝你”,換來了電話那頭的母親隔著電話
        ,傳過來的興奮
        ,“太像太像了”。她用紹興話在電話那頭“嘰里咕嚕”地說著話
        ,似乎已經忘記兒子聽不見自己聲音

        這是一家同樣不會說“歡迎光臨”的理發(fā)店。價低

        ,但手藝被熟客認可
        。熟客們到發(fā)廊時,會用手比劃
        ,或者在寫字板上
        ,用盡量精簡的語言表達自己的理發(fā)訴求。再后來
        ,店里又專門增加了一臺預約機器
        ,用機器取締更多興許不順暢的溝通。

        到訪的那天

        ,沈師傅又迎來了一位熟客
        ,對頭發(fā)的訴求就寫在隨便撕下的紙片上,“兩耳邊修一下
        ,頭后也盡量短點”
        。沈師傅點開自己的聲音,跟他進行了第一次剪發(fā)需求的溝通
        ,不依賴機械的機器人聲
        ,而是被媽媽認可的
        ,像他的聲線的聲音。

        沈師傅的隔壁

        ,就是筑夢無聲烘培
        。沈師傅的人生第一句說給了媽媽,烘培坊的小陳則完成了跟顧客的一次語言溝通

        小陳曾經遇到過商品原材料質量問題

        ,當面跟顧客道歉,又是比劃
        ,又是打字
        。雖然最終沒有發(fā)生大的沖突,但沒法直接說出歉意
        ,讓她很愧疚
        。她同樣也遇到過,因為溝通困難
        ,遇到沒耐心的顧客
        ,明知對方是聽力障礙人士,聽不到卻還是不斷動著嘴巴

        小陳說

        ,這種表達語言的功能,可以讓他們和健全人一樣上班
        。“比如進公司
        、實體門店就不會有阻礙了。”

        小陳用完網易的AI聲音復原工具

        ,店里終于有了“歡迎光臨”的聲音
        。屬于她的聲音,也開始幫助她跟顧客溝通
        。小陳試用后也開始向同學們推介
        ,他們中多數人也同樣因為聽力障礙,而留有遺憾或難以言表的感謝

        網易互娛AI Lab團隊曾經接觸過一個咖啡師

        ,沒有親口對女朋友說過情話
        ,對他而言心中縱有萬千思緒
        ,卻難以言表。他想用自己的聲音說
        ,但原有的AI產品沒有一個能真正實現

        曾經參與世界巡演的舞蹈家顧老師,在一歲左右時同樣因為發(fā)燒打針引起了耳聾

        ,100多分貝的聲音對著她的耳朵
        ,也毫無反應
        。在很長的日子里,爸媽帶著她四處求醫(yī)
        ,針灸
        、吃藥成了家常便飯。但直到女兒出生
        ,她的耳朵也未見好轉
        。如今,她能用自己的音色“說話”了
        ,還彌補了曾經的遺憾
        ,“女兒學說話的時候不能陪她、教她
        。”

        市場上

        ,雖然文字轉換為語音的技術已經高度成熟。比如從最早期的比較機械的聲音
        ,到富有節(jié)奏韻律的語音合成效果
        ,再到在短視頻中成熟應用,可以帶著“情緒”的電影解說配音
        ,這種進化代表著文字到語音轉化技術更加趨近實用
        。但對聽障人士而言,相比于采用統(tǒng)一的聲線合成語音
        ,他們更加渴望能夠使用他們自己獨特的聲線
        ,向周邊人傳遞自己的心聲。努力讓每一個TA
        ,在AI世界里
        ,也能成為獨一無二存在,是技術團隊追逐的目標

        一場公益的共謀

        在社交媒體上

        ,越來越多的聽障人士被關注,也從更大程度上展現了房間里的大象
        。對他們來說
        ,如何與社會自如相處,更便捷
        、準確的溝通
        ,是終身的難題。

        今年5月

        ,網易互娛AI Lab團隊開始思考
        ,在游戲場景之外,如何能把現有的技術拓展到更多的場景。幫助聽障人士“說話”的提議被拎出來討論

        技術是熟悉的

        ,iSpeech技術曾在游戲很多場景應用過,但要應用到聽障人士群體
        ,這個場景是陌生的
        ,他們起初也不知道技術可以做到哪一步。

        為了調研聽障人士是否真的有這個需求

        ,網易找到了浙江省殘疾人福利基金會
        ,做了一次調研。

        調研結果顯示

        ,僅有十分之一的受訪對象能夠通過簡單的口語與身邊的人進行交流
        。更多時候,還是依靠手語
        、更傳統(tǒng)的寫字或借助手機
        。他們中的大多數人經歷過太多想說但說不出的自卑與懊惱,說出“人生第一句”是一部分的“夢想”

        在社交媒體上

        ,也有不少正在通過“音書”等App練習發(fā)音、通過實施轉錄語音聽網課的聽障人士
        ,他們也在通過各種辦法
        ,找回語感、訓練發(fā)音
        、或者找到跟其他人交流更便捷
        、有效的辦法。

        在確認需求后

        ,網易互娛AI Lab團隊總結出來
        ,在現有的技術方案下,音色克隆系統(tǒng)可以通過聽障人士的發(fā)聲片段學習聲線特色
        ,但無論是聲線的錄制
        、錄音上傳后的處理,都需要更便捷地完成

        大多數聽障人士在闡述一句話時

        ,嘴巴在動,但一句話中
        ,興許有部分音節(jié)能出發(fā)聲音
        ,或者只是不完整的句子,沒有語義的聲音
        。這些對采集聲音造成了不小的挑戰(zhàn)
        ,也是團隊主要攻克的難題。最終
        ,他們通過技術層面的升級
        ,僅提取聽障人士的聲紋信息,摒棄了傳統(tǒng)語音合成需要采集上百個句子(超半小時)的語音量
        ,將聲音收集的時間壓縮到最短2分鐘
        ,進而大幅度降低聽障人士的使用門檻。

        為了盡可能提升訓練和合成的效果

        ,網易互娛AI Lab還邀請聲優(yōu)
        、內部人員,設計了大量的文本進行語音錄制
        ,隨后花了大量的精力進行模型的訓練和調參優(yōu)化
        。終于,花了兩個月時間
        ,工具在聚集了許多聽障人士的音書App上線
        。這才有了沈師傅、小陳說出的“人生第一句”

        事實上

        ,由于大多數聽障人士無法完整清晰地表達一句話,因此在音頻被機器學習并轉化之后
        ,他們的聲音中
        ,仍然殘留著“嘶啞聲”。但在此過程中
        ,聽障人士們的一次次努力
        ,一次次溝通,也構成了一些人情感“缺憾里的完美”

        技術如何向善?

        在為聽障人士提供音色復原的技術之前

        ,網易作為一家主營業(yè)務為游戲的公司,早早就把iSpeech技術應用在游戲場景中

        簡單來說

        ,網易的游戲產品中,NPC的語音生成
        、游戲中的系統(tǒng)播報
        、轉換音色等都有了基礎的應用。當一個成熟的新技術被驗證
        ,隨之而來的就是將其作用更極致化
        、鋪展開的過程。

        在開始之前

        ,團隊反復考量
        ,這事要如何更好地推進下去。原本更多只是服務游戲的聲音合成技術,在公益價值上得到了第二次的落地

        根本上

        ,這更多旨在提供社會價值,而非商業(yè)價值
        。網易互娛AI Lab技術總監(jiān)林悅提到
        ,現在沒有考慮(通過這個技術)盈利賺錢。但相關技術除了游戲中應用提高生產效率之外
        ,也在不斷探索新的玩法

        他舉例說,在游戲開發(fā)過程中

        ,一些聲優(yōu)遇到需要補錄的問題時
        ,跨地域、實地到錄音棚的周期會很長
        ,但現在已經可以通過AI以及音色復原的算法
        ,對相應的少量臺詞進行修改。在做聽障人士還原音色項目的過程中
        ,也促使團隊重新梳理語音合成技術的各個細節(jié)和可能提升的方案
        ,這次合作也使得合成技術有了進一步的提升,對未來在游戲中也有了更多應用的可能性

        在做調研時

        ,他們還發(fā)現,一個現實的問題是
        ,聽障人士在使用無障礙通信軟件主要面臨需支付較高費用
        、語音轉文字準確率不夠、翻譯器翻譯有延遲等問題
        。這也是網易將這個技術免費開放給聽障人士的初心之一
        。能盡可能高準確度地,為聽障人士的日常溝通創(chuàng)造“情感”的價值
        ,這也是一定要做出“聲線”的根本所在

        林悅說,下一步的計劃就是能在合成后

        ,還能準確表達出相應的情緒
        。傳統(tǒng)工業(yè)界的做法往往是基于大量的帶情緒的訓練數據,或者是通過文本判斷情緒并在合成時做情感的遷移
        ,但靠聽障人士在錄制數據表達的語義信息
        ,再帶上情感信息的仍然有難點。

        在不少聽障人士的人生故事中

        ,溝通的不便捷會消磨掉一部分時刻的完整性
        。一位參與該項目的人士提到
        ,她記得一個父親說過,他不能說話的遺憾來自
        ,在孩子的婚禮上
        ,他沒辦法做致辭。親口說話不可替代
        ,人生就是有很多時刻
        ,可能就是得親自來講話

        在那場調研中

        ,有超過67%的受訪對象表示“愿意使用音色復原技術”,超過一半的受訪對象表示“愿意將音色復原技術推薦給身邊有需要的人”
        ,也有部分受訪對象表示除了手機 APP 軟件以外
        ,希望音色復原技術應用于在公交、出租
        、飯店
        、超市、銀行等公共場所
        。但這仍然需要長時間的
        ,社會各界的共謀。至少從現在開看
        ,一些人找回了失去的聲音
        ,盡管方式會更曲折。

        沈師傅的故事在無聲街道上被多次關注

        ,在許多的視頻
        、采訪中,沈師傅常常只是打著手語
        ,由不同的人擔當翻譯
        。他喜歡說“奮斗”,總是對來訪者提出的要求充分配合
        。但在使用了音色合成的工具后
        ,沈師傅第一次在視頻中,通過自己的語言
        、聲音闡述自己的經歷
        、思考和期盼,為自己完成了“配音”

         

        關鍵詞:

        責任編輯:孫知兵

        免責聲明:本文僅代表作者個人觀點

        ,與太平洋財富網無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實
        ,對本文以及其中全部或者部分內容
        、文字的真實性
        、完整性、及時性本站不作任何保證或承諾
        ,請讀者僅作參考
        ,并請自行核實相關內容。
        如有問題
        ,請聯系我們

        、虧損突增489億,能否吸引“戰(zhàn)投”?">恒大汽車“財務大洗澡”:營收驟降百億
        、...
      1. 傳自如第三季度沖刺港股,房源100萬套,3...
      2. ,收益率或先降后升">2023下半年債市展望:信用債分層延續(xù)
      3. 成都大運會中國代表團今日正式成立
      4. 明星焦慮:自信最美麗
      5. Mysteel:全國高溫和強降雨情況匯總(7...
      6. ,買現車再降1.8萬?">凱迪拉克LYRIQ銳歌全系降價6萬
      7. ?下賽季薪水僅6917萬">湖人官推展望新賽季:佩總9筆簽約評級滿...
      8. 隰縣舉辦燃氣泄漏應急處置演練 多單位參加
      9. 少女澳洲打工頭發(fā)卷入機器扯掉頭皮
      10. ,或“兩連漲”">國內油價調價窗口12日開啟,或“兩連漲”
      11. 盛世中華 何以中國丨《天選之都》和你...
      12. 快快評丨問題為何總在暗訪“回馬槍”中...
      13. 極端高溫愈演愈烈 全球經濟遭遇“烤”驗
      14. 匯森家居(02127.HK):針對公司的清盤呈...
      15. 關于我們 - 聯系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網站統(tǒng)計
         

        太平洋財富主辦 版權所有:太平洋財富網

        ?中國互聯網違法和不良信息舉報中心中國互聯網違法和不良信息舉報中心

        Copyright© 2012-2020 太平洋財富網(www.rkrking.com) All rights reserved.

        未經過本站允許 請勿將本站內容傳播或復制 業(yè)務QQ:3 31 986 683