崗位職責(zé):
1、針對(duì)具身智能大模型,進(jìn)行數(shù)據(jù)的采集、爬取、清洗、處理、優(yōu)化等全流程,對(duì)模型預(yù)訓(xùn)練和微調(diào)提供高質(zhì)量數(shù)據(jù)。最終形成數(shù)據(jù)-模型閉環(huán)。
2、構(gòu)建數(shù)據(jù)全鏈路(data-centric)的平臺(tái)和工具,統(tǒng)一多模態(tài)數(shù)據(jù)的采集、處理、查詢、管理。
3、利用CV算法、多模態(tài)模型等處理視頻、圖片等多模態(tài)數(shù)據(jù),如物體檢測(cè)、視頻描述等等。
4、指導(dǎo)和管理大規(guī)模數(shù)據(jù)標(biāo)注工作,能夠從數(shù)據(jù)的角度指導(dǎo)模型訓(xùn)練。
任職資格:
1、具備較好的模型算法構(gòu)建能力,能夠借助開(kāi)源項(xiàng)目獨(dú)立訓(xùn)練CV模型或者多模態(tài)模型。對(duì)自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)和多模態(tài)模型有深入且全面的了解者優(yōu)先;
2、有模型推理優(yōu)化加速的經(jīng)驗(yàn),熟悉量化、減枝等工作,能進(jìn)滿足業(yè)務(wù)需求中對(duì)大規(guī)模推理的需求。熟悉VLLM等推理加速框架;
3、具備一定的前后端能力,能夠做簡(jiǎn)單的后端開(kāi)發(fā)。具備利用開(kāi)源框架streamlit等工具開(kāi)發(fā)demo的能力;
4、熟悉Python、git、linux系統(tǒng),具備扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ),有較好的編程基礎(chǔ);
5、熟悉計(jì)算機(jī)網(wǎng)絡(luò)、計(jì)算機(jī)組成原理,具備扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ);
6、熟悉Hadoop、Spark、Flink等大數(shù)據(jù)處理框架,具備實(shí)際項(xiàng)目經(jīng)驗(yàn);
加分項(xiàng):
1、 具備快速學(xué)習(xí)和掌握新領(lǐng)域知識(shí)的能力,以及良好的團(tuán)隊(duì)合作精神 ;
2、計(jì)算機(jī)科學(xué)、軟件工程或相關(guān)領(lǐng)域的本科及以上學(xué)歷。