任職資格:
1.本科及以上學(xué)歷(研究生優(yōu)先),計(jì)算機(jī)、數(shù)據(jù)科學(xué)、人工智能、軟件、通信、自動(dòng)化相關(guān)專業(yè)優(yōu)先。
2.1年以上數(shù)據(jù)清洗/處理經(jīng)驗(yàn)/大數(shù)據(jù)/算法工作經(jīng)驗(yàn),有LLM或NLP項(xiàng)目經(jīng)驗(yàn)者優(yōu)先,優(yōu)秀25屆應(yīng)屆生也可投遞
3.具備非結(jié)構(gòu)化數(shù)據(jù)處理經(jīng)驗(yàn),處理過大規(guī)模TB級(jí)數(shù)據(jù),擅長(zhǎng)代碼編寫
4.強(qiáng)烈的責(zé)任心與團(tuán)隊(duì)協(xié)作能力,適應(yīng)快節(jié)奏技術(shù)迭代。
5.熟練使用Python及主流數(shù)據(jù)科學(xué)棧(NumPy、Pandas等),具備良好的代碼規(guī)范與工程習(xí)慣;熟悉SQL及常見關(guān)系型/分布式數(shù)據(jù)庫
6.熟悉主流分布式計(jì)算或分析框架(如Spark、Hadoop、Rav、Presto等),理解其核心原理與性能調(diào)優(yōu)方法,能在其上開發(fā)或調(diào)優(yōu)數(shù)據(jù)作業(yè)。
7.熟悉主流深度學(xué)習(xí)框架,并對(duì)其訓(xùn)練/微調(diào)流程有深刻理解,能清晰分析數(shù)據(jù)質(zhì)量對(duì)模型性能的影響。
崗位職責(zé):
1.負(fù)責(zé)大模型預(yù)訓(xùn)練數(shù)據(jù)的清洗、去噪與結(jié)構(gòu)化處理,構(gòu)建高質(zhì)量語料庫,支持模型訓(xùn)練需求。
2.設(shè)計(jì)并實(shí)現(xiàn)基于Python的高效數(shù)據(jù)處理Pipeline,優(yōu)化數(shù)據(jù)預(yù)處理流程,提升數(shù)據(jù)質(zhì)量。
3.擅長(zhǎng)對(duì)接數(shù)據(jù)采集(上游)與模型訓(xùn)練(下游),制定數(shù)據(jù)規(guī)范、質(zhì)量監(jiān)控及閉環(huán)優(yōu)化策略,確保數(shù)據(jù)-模型高效協(xié)同
4.構(gòu)建數(shù)據(jù)自動(dòng)化評(píng)估體系,研究自動(dòng)化評(píng)估算法,能夠高效評(píng)估無些督、有些督等各類數(shù)據(jù)質(zhì)量,
5.追蹤業(yè)界開源數(shù)據(jù)進(jìn)展,清晰了解業(yè)界高質(zhì)量數(shù)據(jù)構(gòu)建體系方法,為星火大模型訓(xùn)練數(shù)據(jù)提供支持。
上班時(shí)間:朝九晚六,周末雙休,節(jié)假日正常休
薪資:10-30K面試定薪+餐補(bǔ)300+交補(bǔ)150+年終獎(jiǎng)
福利待遇:
1、入職五險(xiǎn)一金、帶薪假期、節(jié)日福利、年度體檢;
2、食堂:提供豐富多樣、健康美味的飲食選擇;
3、健身房:免費(fèi)健身房,在工作之余保持健康的身體狀態(tài);
4、圖書館:免費(fèi)圖書館,豐富多樣的圖書資源和舒適的閱讀環(huán)境;
5、公租房/租房補(bǔ)貼:符合政策的員工可申請(qǐng)公租房或租房補(bǔ)貼,減輕生活壓力;
6、人才補(bǔ)貼:符合政策的員工可申請(qǐng)政府人才補(bǔ)貼,提高員工的福利待遇;
7、員工團(tuán)建:不定期組織團(tuán)建活動(dòng),在輕松愉悅的氛圍中放松身心,增強(qiáng)團(tuán)隊(duì)凝聚力;
8、員工成長(zhǎng):提供多方位學(xué)習(xí)通道,包括系統(tǒng)化專業(yè)課程的在線學(xué)習(xí)平臺(tái)、大咖分享、技術(shù)沙龍等;