工作職責(zé):
1. 負(fù)責(zé)或參與基礎(chǔ)大規(guī)模語言模型的構(gòu)建與迭代優(yōu)化;
2. 負(fù)責(zé)對大規(guī)模語言模型的推理性能進(jìn)行極致優(yōu)化;
3. 負(fù)責(zé)研發(fā)面向行業(yè)和業(yè)務(wù)的專項模型,根據(jù)行業(yè)和業(yè)務(wù)的需求完成算法和模型的調(diào)優(yōu);
4. 負(fù)責(zé)大模型前沿技術(shù)的跟蹤與研發(fā)。
任職資格:
1. 人工智能、機(jī)器學(xué)習(xí)、自然語言處理等相關(guān)專業(yè)碩士及以上學(xué)歷,有優(yōu)秀的編程和數(shù)學(xué)基礎(chǔ),以及扎實的數(shù)據(jù)結(jié)構(gòu)和算法功底;
2. 熟練掌握C/C++或Python并有實際項目經(jīng)歷;熟悉PyTorch、TensorFlow中至少一種深度學(xué)習(xí)框架并有實際項目經(jīng)歷;
3. 在大模型預(yù)訓(xùn)練、對齊、推理等方面有至少半年的項目經(jīng)驗;
4. 有過千卡模型訓(xùn)練經(jīng)驗者優(yōu)先;曾主導(dǎo)過語言大模型方向產(chǎn)品研發(fā)工作者優(yōu)先;ACM/NOI/IOI/Top Coder 等比賽獲獎?wù)邇?yōu)先;在自然語言處理和機(jī)器學(xué)習(xí)等領(lǐng)域的頂級國際會議/期刊上以主要作者發(fā)表過論文者優(yōu)先。