微軟推出DragonV2.1語音模型
2025-08-01 16:38 微軟

微軟近日發(fā)布新一代DragonV2.1 Neural零次學(xué)習(xí)模型,該文本轉(zhuǎn)語音系統(tǒng)僅需數(shù)秒語音樣本即可生成超100種語言的逼真語音。相比前代產(chǎn)品,新模型在發(fā)音準(zhǔn)確性方面取得突破性進(jìn)展,單詞錯(cuò)誤率平均降低12.8%,特別改善了專有名詞的發(fā)音問題。這項(xiàng)技術(shù)創(chuàng)新通過SSML音素標(biāo)簽和自定義詞典實(shí)現(xiàn)精準(zhǔn)的發(fā)音控制,可應(yīng)用于智能客服語音定制、多語言視頻配音等場景。微軟同步推出Andrew、Ava等預(yù)設(shè)音色庫,方便用戶體驗(yàn)其卓越的自然語言表現(xiàn)力。