崗位職責(zé):
1. 深入對(duì)接客戶側(cè),精準(zhǔn)理解其在多模態(tài)大模型(如圖文、語音、視頻等)訓(xùn)練場景下的業(yè)務(wù)痛點(diǎn)與數(shù)據(jù)需求,主導(dǎo)設(shè)計(jì)高效、可靠、可落地的多模態(tài)大數(shù)據(jù)解決方案;
2. 負(fù)責(zé)規(guī)劃并管理多模態(tài)數(shù)據(jù)(文本、圖像、音頻、視頻等)的ETL全鏈路工作流程,包括數(shù)據(jù)采集、清洗、標(biāo)注、預(yù)處理、質(zhì)量校驗(yàn)、存儲(chǔ)與管理等環(huán)節(jié)的規(guī)范制定與效率優(yōu)化;
3. 高效協(xié)同內(nèi)部大數(shù)據(jù)開發(fā)工程師、算法工程師、標(biāo)注團(tuán)隊(duì)等,明確數(shù)據(jù)需求與技術(shù)實(shí)現(xiàn)路徑,確保數(shù)據(jù)pipeline的順利構(gòu)建與交付,保障模型訓(xùn)練的數(shù)據(jù)供給與質(zhì)量;
4. 持續(xù)跟蹤多模態(tài)大數(shù)據(jù)領(lǐng)域的前沿技術(shù)、行業(yè)最佳實(shí)踐與政策法規(guī),為產(chǎn)品與解決方案的迭代創(chuàng)新提供輸入。
任職要求:
1. 本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、人工智能等相關(guān)專業(yè)優(yōu)先;具備3年以上大數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)項(xiàng)目經(jīng)理或ToB/ToG解決方案顧問經(jīng)驗(yàn);
2. 深刻理解多模態(tài)大數(shù)據(jù)的特性和處理難點(diǎn),熟悉大數(shù)據(jù)ETL全鏈路理念與流程,熟悉至少一種主流大數(shù)據(jù)技術(shù)棧(如Hadoop, Spark, Flink, Kafka等),了解數(shù)據(jù)倉庫、數(shù)據(jù)湖、向量數(shù)據(jù)庫等概念,對(duì)數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量有深刻認(rèn)知;
3. 具備數(shù)據(jù)清洗規(guī)則制定、分布式處理框架選型、數(shù)據(jù)存儲(chǔ)優(yōu)化等相關(guān)解決方案經(jīng)驗(yàn);
4. 擁有出色的客戶溝通、需求挖掘和關(guān)系維護(hù)能力;有政府、國央企、大型傳統(tǒng)行業(yè)等客戶項(xiàng)目對(duì)接經(jīng)驗(yàn)者優(yōu)先;
5. 具備極強(qiáng)的邏輯思維、項(xiàng)目推動(dòng)力和解決問題能力,能承受壓力,適應(yīng)多任務(wù)并行的工作環(huán)境。