百度大腦語音能力引擎論壇舉行,百度大腦宣布語音能力引擎日均調(diào)用量已經(jīng)超過100億次,應(yīng)用規(guī)模業(yè)界第一,為開發(fā)者提供了覆蓋云、端、芯的全棧全場景語音開放能力,推動(dòng)智能語音技術(shù)在各行業(yè)落地應(yīng)用。
論壇上,百度大腦語音引擎全新發(fā)布和升級(jí)了14大產(chǎn)品內(nèi)容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板及3大場景解決方案,升級(jí)了語音自訓(xùn)練平臺(tái)、呼叫中心語音解決方案等。來自家電、農(nóng)業(yè)、醫(yī)療等行業(yè)的合作伙伴代表也在現(xiàn)場分享了百度大腦語音技術(shù)賦能的成果。
百度首席技術(shù)官王海峰博士出席論壇并致辭,他表示:“AI技術(shù)的進(jìn)化和產(chǎn)業(yè)賦能正向循環(huán),相互促進(jìn),AI在應(yīng)用場景中不斷進(jìn)化。百度的語音技術(shù)基于深度學(xué)習(xí)和產(chǎn)業(yè)應(yīng)用加速突破,已應(yīng)用到百度App、百度地圖、小度音箱,百度輸入法等百度產(chǎn)品,更通過AI開放平臺(tái)賦能眾多產(chǎn)業(yè)伙伴。百度大腦語音能力每天的調(diào)用量已經(jīng)超過100億。”
現(xiàn)場,百度語音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),消除學(xué)科間壁壘,直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,錯(cuò)誤率降低超過30%。目前該方法已經(jīng)被集成到百度最新發(fā)布的百度鴻鵠芯片中。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語音能力引擎的應(yīng)用規(guī)模已達(dá)到業(yè)界第一,同時(shí)一直在積極拓展語音能力引擎生態(tài)鏈的建設(shè)。
針對(duì)智能硬件設(shè)備,百度大腦重磅發(fā)布基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板,以及智能家居、智能車載、智能IoT設(shè)備3大端到端軟硬一體遠(yuǎn)場語音交互場景解決方案,具備交互效果優(yōu)異、軟硬一體快速應(yīng)用、廣泛兼容集成門檻低等優(yōu)點(diǎn)。
同時(shí),在語音識(shí)別領(lǐng)域,全面升級(jí)短語音識(shí)別、實(shí)時(shí)語音識(shí)別能力,發(fā)布音頻文件轉(zhuǎn)寫能力,升級(jí)可零代碼提升業(yè)務(wù)術(shù)語識(shí)別率的語音自訓(xùn)練平臺(tái),以及呼叫中心語音解決方案;在語音合成方面,全新發(fā)布6個(gè)在線語音合成精品音庫和5個(gè)離線語音合成精品音庫。豐富的語音能力,助力智能硬件、互聯(lián)網(wǎng)、呼叫中心等領(lǐng)域智能化升級(jí)。
論壇上,來自家居、金融、醫(yī)療、農(nóng)業(yè)、公益等領(lǐng)域的合作伙伴,登臺(tái)分享與百度大腦合作的細(xì)節(jié),以及如何以語音技術(shù)助力自身完成智能化升級(jí)。
創(chuàng)維AIoT研究院產(chǎn)品經(jīng)理李凱介紹:“大屏IoT的行業(yè)痛點(diǎn)在于信息檢索難和設(shè)備控制操作復(fù)雜,通過增加語音交互能力,重構(gòu)了整個(gè)AIoT設(shè)備生態(tài)的交互體驗(yàn)。雙方在電視方面的合作成果已落地在10個(gè)電視芯片型號(hào)、2500萬臺(tái)電視上,助力中端及高端產(chǎn)品線提升了產(chǎn)品溢價(jià)能力?!痹谙乱淮h(yuǎn)場語音方案中,百度鴻鵠語音芯片為創(chuàng)維產(chǎn)品帶來了高性價(jià)比硬件、整合優(yōu)化的軟件算法等價(jià)值,雙方將基于百度鴻鵠芯片展開多項(xiàng)產(chǎn)品的合作。
瓴岳科技信貸運(yùn)營總監(jiān)宋力現(xiàn)場分享了百度大腦語音技術(shù)在貸后領(lǐng)域的應(yīng)用,依托百度大腦呼叫中心實(shí)時(shí)語音識(shí)別等AI服務(wù)對(duì)用戶語音的準(zhǔn)確識(shí)別,瓴岳打造了降本提效的智能機(jī)器人。通過貸后智能機(jī)器人、智能語音質(zhì)檢的應(yīng)用,貸后人力投入降低61.47%,有效實(shí)現(xiàn)了合規(guī)和高效的運(yùn)營體系,提高了客戶體驗(yàn)。
北京子杰寶貝科技有限公司項(xiàng)目經(jīng)理肖云峰在會(huì)上展現(xiàn)了語音技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用:“我們開發(fā)的智能錄入系統(tǒng)在百度大腦語音自訓(xùn)練平臺(tái)進(jìn)行語音識(shí)別模型訓(xùn)練,識(shí)別率從80%提升至95%以上,包括醫(yī)療專業(yè)生僻詞的識(shí)別,而很多廠商模型識(shí)別率都達(dá)不到這個(gè)要求。該系統(tǒng)有效降低了醫(yī)護(hù)人員的工作強(qiáng)度,提升了臨床護(hù)理效率?!?/p>
在農(nóng)業(yè)領(lǐng)域,也遇到了農(nóng)業(yè)作物專業(yè)詞匯語音識(shí)別率低的行業(yè)問題,對(duì)此華智生物信息技術(shù)主任龍曉波表示:“得益于百度大腦語音自訓(xùn)練平臺(tái)使用簡單、準(zhǔn)確率高、可拓展等優(yōu)點(diǎn),經(jīng)多次迭代我們的農(nóng)業(yè)結(jié)構(gòu)化性狀數(shù)據(jù)語音識(shí)別準(zhǔn)確率從71.09%提升至98.75%,采集一個(gè)測試田地性狀信息從300人工時(shí)降低到160人工時(shí),工作效率提升了一倍。”
善行智能聯(lián)合創(chuàng)始人黃小瑰介紹了基于百度大腦語音等技術(shù)打造的小Q智能導(dǎo)盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助?,F(xiàn)場還發(fā)布了“因AI而聲”公益計(jì)劃:百度大腦將為提供公益性服務(wù)的公司或組織,提供語音技術(shù)免費(fèi)、專屬語音技術(shù)支持等福利,為特殊群體帶去便利和幫助,讓 AI 有溫度。
百度大腦開放平臺(tái)是國內(nèi)服務(wù)規(guī)模最大的AI開放平臺(tái),目前已開放228項(xiàng)AI能力,擁有超過150萬的開發(fā)者用戶。
與會(huì)人士認(rèn)為,此次百度大腦語音技術(shù)能力的全新發(fā)布和升級(jí),為開發(fā)者和企業(yè)提供了更加完善的全棧語音引擎能力,將幫助更多用戶高效打造具備語音交互能力的特色應(yīng)用與產(chǎn)品,加快語音技術(shù)在各行各業(yè)的應(yīng)用落地進(jìn)程。
百度AI開放平臺(tái),是面向企業(yè)、機(jī)構(gòu)、創(chuàng)業(yè)者、研發(fā)者,將百度在人工智能領(lǐng)域積累的技術(shù)以API或SDK等形式對(duì)外共享的在線平臺(tái)。提供全球前沿的語音識(shí)別與合成、OCR、人臉識(shí)別、NLP等數(shù)十項(xiàng)服務(wù),開放DuerOS、Apollo兩大行業(yè)生態(tài),享應(yīng)用場景和解決方案,幫您提升競爭力,開創(chuàng)未來。
提供全球精良的語音、圖像、NLP等多項(xiàng)人工智能技術(shù),開放對(duì)話式人工智能系統(tǒng)、智能駕駛系統(tǒng)兩大行業(yè)生態(tài),共享AI領(lǐng)域新的應(yīng)用場景和解決方案,您提升競爭力。
滴滴出行在日本引進(jìn)了采用語音識(shí)別技術(shù)接受顧客訂單的新機(jī)制。駕駛員通過APP收到打車訂單時(shí),...
據(jù)外媒報(bào)道,亞馬遜承認(rèn),其仍然保留從Alexa和 Echo設(shè)備獲得的存儲(chǔ)數(shù)據(jù),即使用戶選擇...
阿里巴巴發(fā)布語音合成技術(shù)KAN-TTS,基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到9...
德國聯(lián)邦議院發(fā)布評(píng)估報(bào)告稱,美國亞馬遜公司的“亞歷克薩”語音系統(tǒng)對(duì)用戶有風(fēng)險(xiǎn)。聯(lián)邦議院的這...
搜狗語音率先對(duì)語音識(shí)別技術(shù)進(jìn)行了革新優(yōu)化,推出“個(gè)性化語音識(shí)別”服務(wù)。經(jīng)過本輪更新,用戶只...
小米集團(tuán)副總裁、集團(tuán)技術(shù)委員會(huì)主席崔寶秋在社交媒體上宣布,國際語音辨認(rèn)和AI領(lǐng)域的著名傳授...