工作職責(zé)
1、組建并管理數(shù)據(jù)工程團隊,涵蓋開發(fā)與管理人才、制定考核標(biāo)準(zhǔn)、促進(jìn)團隊成長。
2、負(fù)責(zé)文本、圖像、視頻、傳感器、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)數(shù)據(jù)建模,定義數(shù)據(jù)標(biāo)準(zhǔn),負(fù)責(zé)數(shù)據(jù)智能體產(chǎn)品各環(huán)節(jié)數(shù)據(jù)支持,包括數(shù)據(jù)處理、模型評測、結(jié)果整合、數(shù)據(jù)統(tǒng)計等。
3、設(shè)計多模態(tài)數(shù)據(jù)Pipeline,選型技術(shù)棧。負(fù)責(zé)圖像、視頻、音頻的數(shù)據(jù)自動化處理流程,包括格式轉(zhuǎn)換、搭建清洗鏈路、數(shù)據(jù)可視化等,構(gòu)建數(shù)據(jù)質(zhì)量管控機制,確保數(shù)據(jù)準(zhǔn)確性、一致性。
4、與知識工程團隊協(xié)作,定義數(shù)據(jù)-知識映射關(guān)系,支撐知識抽取與融合。
5、優(yōu)化數(shù)據(jù)處理性能,滿足實時/準(zhǔn)實時決策需求。
任職要求
1、碩士及以上學(xué)歷,計算機、數(shù)據(jù)科學(xué)或相關(guān)專業(yè),8年以上大數(shù)據(jù)架構(gòu)師/工程師經(jīng)驗,其中3年以上團隊管理經(jīng)驗,處理過TB級文本、圖像、傳感器數(shù)據(jù),具備多個大數(shù)據(jù)平臺設(shè)計架構(gòu)、數(shù)據(jù)架構(gòu)、數(shù)據(jù)治理等項目經(jīng)驗者優(yōu)先。
2、精通OCR、CV、NLP、語音識別等多模態(tài)數(shù)據(jù)處理技術(shù),熟悉至少兩種分布式計算框架,對大模型預(yù)訓(xùn)練、微調(diào)、評測等內(nèi)部邏輯及具體流程有一定了解,具有豐富的工程開發(fā)經(jīng)驗,能基于python進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)可視化等功能開發(fā),有自動化流程開發(fā)經(jīng)驗者優(yōu)先;有圖像處理、音視頻處理經(jīng)驗者優(yōu)先。
3、有政府/互聯(lián)網(wǎng)/央國企等大型組織大規(guī)模多模態(tài)數(shù)據(jù)平臺建設(shè)經(jīng)驗;熟悉主數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)(含指標(biāo)標(biāo)準(zhǔn)、業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn))、數(shù)據(jù)建模等政企數(shù)據(jù)治理相關(guān)的體系和方法,有行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)規(guī)范建設(shè)經(jīng)驗優(yōu)先。
4、了解本體工程/知識圖譜技術(shù),具備數(shù)據(jù)與知識融合的實踐經(jīng)驗,持有CDA數(shù)據(jù)架構(gòu)師認(rèn)證者優(yōu)先。
具有較強的學(xué)習(xí)能力、邏輯分析能力、問題排查能力,良好的溝通能力和團隊協(xié)作精神,主觀能動性強,認(rèn)真細(xì)致,責(zé)任心強,能主動發(fā)現(xiàn)問題。