崗位職責(zé):1.負(fù)責(zé)海洋專業(yè)數(shù)據(jù)體系的規(guī)劃與構(gòu)建,根據(jù)實(shí)驗(yàn)室海洋大模型研發(fā)方向,調(diào)研、制定并執(zhí)行多模態(tài)海洋數(shù)據(jù)集的建設(shè)方案與發(fā)展路線圖。
2.主導(dǎo)大規(guī)模、多源異構(gòu)海洋數(shù)據(jù)的采集與治理工作。負(fù)責(zé)對(duì)接并集成國內(nèi)外多樣化的數(shù)據(jù)源,運(yùn)用多種技術(shù)手段獲取數(shù)據(jù);設(shè)計(jì)體系化的數(shù)據(jù)清洗、去噪、格式化與標(biāo)準(zhǔn)化流程,解決數(shù)據(jù)缺失、異常與不一致問題。
3.構(gòu)建與優(yōu)化數(shù)據(jù)標(biāo)注體系,設(shè)計(jì)與海洋領(lǐng)域知識(shí)深度結(jié)合的數(shù)據(jù)標(biāo)注規(guī)則與規(guī)范;管理數(shù)據(jù)標(biāo)注團(tuán)隊(duì)或協(xié)調(diào)標(biāo)注資源,確保標(biāo)注工作的效率與質(zhì)量,為模型訓(xùn)練提供高置信度的監(jiān)督數(shù)據(jù)。
4.研發(fā)數(shù)據(jù)管理平臺(tái)與工具,搭建和維護(hù)實(shí)驗(yàn)室級(jí)海洋數(shù)據(jù)集管理平臺(tái),實(shí)現(xiàn)數(shù)據(jù)版本管理、元數(shù)據(jù)管理及訪問控制;開發(fā)自動(dòng)化數(shù)據(jù)處理與質(zhì)檢工具,提升數(shù)據(jù)的整體效率與可靠性。
5.負(fù)責(zé)數(shù)據(jù)集的質(zhì)量評(píng)估與效能分析:建立數(shù)據(jù)集質(zhì)量評(píng)估指標(biāo)體系,對(duì)數(shù)據(jù)集進(jìn)行多維度的量化評(píng)估與分析;跟蹤下游模型性能與數(shù)據(jù)質(zhì)量的關(guān)聯(lián)關(guān)系,為數(shù)據(jù)集的迭代優(yōu)化提供決策依據(jù)。