1. 執(zhí)行圖像、文本、語音等不同類型的數(shù)據(jù)進(jìn)行分類、注釋及標(biāo)記,為AI模型訓(xùn)練提供高質(zhì)量數(shù)據(jù)支持;
2. 對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理與清洗,識(shí)別并剔除噪聲數(shù)據(jù);
3. 維護(hù)標(biāo)注數(shù)據(jù)集的版本管理及元信息記錄;
4. 協(xié)助團(tuán)隊(duì)完成數(shù)據(jù)集的構(gòu)建,確保數(shù)據(jù)標(biāo)注的準(zhǔn)確性與一致性;
5. 協(xié)同算法團(tuán)隊(duì)理解標(biāo)注需求,保障標(biāo)注數(shù)據(jù)支撐模型訓(xùn)練目標(biāo);
6. 協(xié)助開發(fā)團(tuán)隊(duì)測(cè)試標(biāo)注工具,反饋功能優(yōu)化點(diǎn);
7. 參與數(shù)據(jù)標(biāo)注流程的優(yōu)化和改進(jìn),提出提高效率和質(zhì)量的建議;
8. 定期匯報(bào)工作進(jìn)度,參與團(tuán)隊(duì)討論和技術(shù)交流。
能力要求:
1、計(jì)算機(jī)、軟件或相關(guān)專業(yè),本科及以上學(xué)歷,2年以上數(shù)據(jù)開發(fā)相關(guān)經(jīng)驗(yàn);
2、有業(yè)務(wù)數(shù)據(jù)調(diào)研分析能力,熟悉數(shù)據(jù)倉(cāng)庫(kù)原理,熟悉范式、維度等主流建模理論;
3、有實(shí)際模型設(shè)計(jì)及ETL開發(fā)經(jīng)驗(yàn),熟悉HQL,掌握各種場(chǎng)景SQL處理能力,熟悉Linux平臺(tái);
4、熟悉關(guān)系型數(shù)據(jù)的開發(fā),如:Mysql/drds/Postgresql/Oracle/Sqlserver;
5、熟悉Hadoop生態(tài)體系如:Hive、Kafka、Spark、Flink、HBase、流式計(jì)算等技術(shù),有Hadoop實(shí)戰(zhàn)使用經(jīng)驗(yàn):
6、精通Python,Java、Scala等任一編程語言;
7、良好的團(tuán)隊(duì)合作意識(shí),較強(qiáng)的溝通能力。