您當(dāng)前位置>首頁 > 人工智能 > AI語音轉(zhuǎn)寫系統(tǒng)
您當(dāng)前位置>首頁 > 人工智能 > AI語音轉(zhuǎn)寫系統(tǒng)
智慧會議語音轉(zhuǎn)寫系統(tǒng),將發(fā)言語音內(nèi)容實(shí)時轉(zhuǎn)換成文字。會議語音轉(zhuǎn)寫系統(tǒng)可實(shí)現(xiàn)語音轉(zhuǎn)寫的智能語音產(chǎn)品,其核心功能包括:實(shí)時會議轉(zhuǎn)寫和音頻轉(zhuǎn)寫。產(chǎn)品界面簡單易用,用戶通過本款產(chǎn)品可以快速完成會議的實(shí)時記錄與整理,也可以對已經(jīng)錄制好的音頻進(jìn)行整理,提升紀(jì)要整理的效率及效果。
智慧語音系統(tǒng)內(nèi)置的聲學(xué)模型以漢語拼音聲韻母為基本識別單元進(jìn)行聲學(xué)建模,兼顧了模型的顆粒度及可擴(kuò)展性。為了提高模型訓(xùn)練的魯棒性,采用數(shù)萬小時:全面用語音數(shù)據(jù),并進(jìn)行了dataauament,主要包括speed,/volumn/,RIR/pitch,/noise perturbation 等手段,把訓(xùn)練數(shù)報量又?jǐn)U大了20倍。支持語言模型和聲學(xué)模型定制化。語言模型可針對客戶的行業(yè)領(lǐng)域的專有詞匯、行業(yè)術(shù)語等做優(yōu)化,如業(yè)務(wù)流程中的熱詞資源可以通過語言模型實(shí)時訓(xùn)練后,達(dá)到理想的識別效果;聲學(xué)模型則針對客戶所屬地區(qū)的口音做針對性優(yōu)化。針對業(yè)務(wù)中出現(xiàn)的新興詞匯,可通過自定義發(fā)音的熱詞機(jī)制做到即時支持,無需做額外的模型訓(xùn)練工作。熱詞數(shù)量支持萬條以上,并可在運(yùn)行時靈活切換。