某互聯(lián)網(wǎng)大廠,大模型崗位方向眾多都在緊急招聘中,有大模型基礎(chǔ)標(biāo)注崗,Ai訓(xùn)練師,多模態(tài),Agent,評(píng)測(cè),AI搜索評(píng)估,英文AI訓(xùn)練師,代碼方向,理科方向等,base地:北京、成都、上海,高薪雙休不加班,晉升漲薪機(jī)會(huì)大,對(duì)AI行業(yè)感興趣的可以隨時(shí)聯(lián)系我們~~
崗位名稱:AI Agent 評(píng)測(cè)
崗位職責(zé):
1、負(fù)責(zé)按照評(píng)測(cè)標(biāo)準(zhǔn)執(zhí)行AI Agent產(chǎn)品的多維度評(píng)測(cè),確保結(jié)果準(zhǔn)確可靠。
2、保質(zhì)保量地完成評(píng)測(cè)任務(wù),保持高效與細(xì)致的工作節(jié)奏;在不同項(xiàng)目或評(píng)測(cè)任務(wù)之間能夠靈活切換,迅速適應(yīng)新場(chǎng)景與標(biāo)準(zhǔn)要求。
3、對(duì)評(píng)測(cè)中發(fā)現(xiàn)的問(wèn)題進(jìn)行歸因,并基于評(píng)測(cè)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與分析,產(chǎn)出結(jié)構(gòu)化評(píng)測(cè)報(bào)告,提出針對(duì)性改進(jìn)建議,并協(xié)同算法、產(chǎn)品團(tuán)隊(duì)推動(dòng)優(yōu)化閉環(huán)。
4、參與評(píng)測(cè)流程、標(biāo)準(zhǔn)及工具平臺(tái)的持續(xù)完善,推動(dòng)自動(dòng)化評(píng)測(cè)與數(shù)據(jù)追蹤機(jī)制建設(shè),提升評(píng)測(cè)效率與一致性。
5、針對(duì)新興Agent能力或復(fù)雜業(yè)務(wù)場(chǎng)景,探索評(píng)測(cè)維度與方法,設(shè)計(jì)創(chuàng)新性測(cè)試方案,助力構(gòu)建系統(tǒng)化的Agent評(píng)測(cè)體系。
崗位基本需求:
1、??萍耙陨蠈W(xué)歷,計(jì)算機(jī)、人工智能、數(shù)據(jù)分析、心理學(xué)等相關(guān)專業(yè)優(yōu)先。
2、具備1年以上AI產(chǎn)品評(píng)測(cè)相關(guān)經(jīng)驗(yàn),熟悉評(píng)測(cè)流程、標(biāo)準(zhǔn)及常用工具;能夠高效執(zhí)行評(píng)測(cè)任務(wù)并輸出高質(zhì)量報(bào)告。
3、具備扎實(shí)的邏輯思維與問(wèn)題分析能力,能對(duì)評(píng)測(cè)結(jié)果進(jìn)行系統(tǒng)化歸因;4、具備良好的溝通與協(xié)作意識(shí),能夠與算法、產(chǎn)品、研發(fā)團(tuán)隊(duì)高效配合推動(dòng)問(wèn)題閉環(huán)。
5、細(xì)致認(rèn)真、責(zé)任心強(qiáng),能在多任務(wù)、高節(jié)奏的環(huán)境下保持高質(zhì)量交付,并具備靈活應(yīng)變能力,快速適應(yīng)不同場(chǎng)景的評(píng)測(cè)任務(wù)。
6、熟悉Python、Java等編程語(yǔ)言,具備自動(dòng)化評(píng)測(cè)或數(shù)據(jù)分析經(jīng)驗(yàn)者優(yōu)先。
其他信息:
1、需求公司:互聯(lián)網(wǎng)大廠(外包崗位)
2、工作時(shí)間:早9晚6,或早10晚7,周末雙休,法定節(jié)假日休
3、薪資方案:北京:10k-19k(80%固薪+20%績(jī)效)
4、其他福利:五險(xiǎn)一金、年度體檢
5、面試流程:推送簡(jiǎn)歷+推薦理由+學(xué)歷/照片--篩選通過(guò)--預(yù)約線上面試時(shí)間--面試通過(guò)hr定薪
6、base地:北京:北京市朝陽(yáng)區(qū)望京恒電大廈