阿里巴巴發(fā)布語音合成技術(shù)KAN-TTS,基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。融合了端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù),從多個(gè)方面改進(jìn)了語音合成。普通用戶定制“AI聲音”的門檻更低了。
阿里巴巴發(fā)布語音合成技術(shù)KAN-TTS,據(jù)介紹,該技術(shù)可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。
KAN-TTS技術(shù)由達(dá)摩院機(jī)器智能實(shí)驗(yàn)室自主研發(fā)。阿里方面稱,基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。
據(jù)悉,KAN-TTS深度融合了端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù),從多個(gè)方面改進(jìn)了語音合成。傳統(tǒng)語音合成定制需要10小時(shí)以上的數(shù)據(jù)錄制和標(biāo)注,對(duì)錄音人和錄音環(huán)境要求很高。從啟動(dòng)定制到最終交付,項(xiàng)目周期長成本高。
而阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法,將語音合成定制周期壓縮3倍以上。也就是說,用1小時(shí)有效錄音數(shù)據(jù)和不到兩個(gè)月制作周期,就能完成一次標(biāo)準(zhǔn)TTS定制。
此外,這使得普通用戶定制“AI聲音”的門檻更低。只需手機(jī)錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。
阿里巴巴集團(tuán)正式在香港交易所掛牌上市,成為首個(gè)同時(shí)在美股和港股上市的中國互聯(lián)網(wǎng)公司。這個(gè)行...
杭州2022年第19屆亞運(yùn)會(huì)組委會(huì)宣布,阿里巴巴成為杭州亞運(yùn)會(huì)官方合作伙伴。作為創(chuàng)新技術(shù),...
阿里巴巴集團(tuán)正式在港交所掛牌上市,開盤187港元,阿里巴巴此次發(fā)行5億股新股,另有7500...
天貓、菜鳥、螞蟻金服……不管是內(nèi)部孵化,還是投資收購,阿里系的新伙伴一般都會(huì)為它想個(gè)動(dòng)物的...