職位概述
負(fù)責(zé)工業(yè)與服務(wù)機(jī)器人語(yǔ)音識(shí)別系統(tǒng)的算法研發(fā)與優(yōu)化工作。主要聚焦在多通道環(huán)境下的語(yǔ)音信號(hào)處理與識(shí)別模型設(shè)計(jì),確保語(yǔ)音指令解析的準(zhǔn)確性與實(shí)時(shí)性。
核心職責(zé)
?負(fù)責(zé)端側(cè)及云端語(yǔ)音識(shí)別系統(tǒng)的整體設(shè)計(jì)、實(shí)現(xiàn)與性能優(yōu)化;
?研究并開發(fā)語(yǔ)音前端算法,包括波束形成、回聲消除、語(yǔ)音活動(dòng)檢測(cè)、降噪等;
?訓(xùn)練及微調(diào)輕量化ASR模型(如 Paraformer、Whisper、Wenet 等),并進(jìn)行多場(chǎng)景適配;
?與對(duì)話系統(tǒng)、控制系統(tǒng)協(xié)作,實(shí)現(xiàn)語(yǔ)音識(shí)別到ROS2控制指令的無(wú)縫對(duì)接;
?構(gòu)建和維護(hù)噪聲魯棒性測(cè)試體系及評(píng)估標(biāo)準(zhǔn)。
基本要求
?計(jì)算機(jī)、電子工程、信號(hào)處理或相關(guān)專業(yè)碩士及以上學(xué)歷;
?熟悉主流語(yǔ)音識(shí)別架構(gòu)(CTC、RNN-T、Transformer、Conformer等);
?精通語(yǔ)音信號(hào)處理與語(yǔ)音前端算法;
?熟練掌握 Python/C++,具備深度學(xué)習(xí)框架(PyTorch、TensorFlow)實(shí)際項(xiàng)目經(jīng)驗(yàn)。
加分條件
?具備麥克風(fēng)陣列算法、噪聲建模或聲學(xué)前端聯(lián)調(diào)經(jīng)驗(yàn);
?有端側(cè)模型壓縮、量化及部署經(jīng)驗(yàn)(Jetson/RK/NPU平臺(tái));
?參與過(guò)ASR或DCASE競(jìng)賽項(xiàng)目。
候選人特質(zhì)
?語(yǔ)音感知與信號(hào)理解的真實(shí)世界問(wèn)題充滿熱情;
?具備扎實(shí)的算法基礎(chǔ)與優(yōu)秀的工程實(shí)現(xiàn)能力;
?擁有嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)精神與數(shù)據(jù)驅(qū)動(dòng)的研究方法;
?積極關(guān)注前沿語(yǔ)音識(shí)別與魯棒建模技術(shù)的發(fā)展;
?具備團(tuán)隊(duì)協(xié)作意識(shí),能在跨學(xué)科環(huán)境中高效溝通。