【崗位職責】:
1、負責強化學習算法的研究、開發(fā)和應用,解決實際問題并提升業(yè)務效果;
2、設計和實現(xiàn)強化學習模型,包括但不限于價值迭代、策略梯度、模型預測控制等算法;
3、對現(xiàn)有強化學習算法進行優(yōu)化和改進,提高算法的穩(wěn)定性和收斂速度;
4、與數(shù)據(jù)工程師和產(chǎn)品團隊合作,將強化學習算法集成到產(chǎn)品和服務中;
5、跟蹤強化學習領域的最新研究進展,不斷探索和創(chuàng)新,推動公司技術發(fā)展;
6、參與撰寫技術文檔,為團隊提供算法知識和技能培訓;
7、參與項目的需求分析、方案設計和技術評審。
【任職要求】:
1、計算機科學、人工智能、數(shù)學或相關專業(yè)碩士及以上學歷,有3年以上強化學習算法開發(fā)經(jīng)驗;
2、熟悉強化學習的基本理論和算法,如Q-Learning、SARSA、Deep Q-Network (DQN)、Policy Gradient等;
3、具備扎實的數(shù)學基礎,包括概率論、統(tǒng)計學、線性代數(shù)等;
4、熟練掌握至少一種編程語言,如Python,并熟悉TensorFlow、PyTorch等深度學習框架;
5、具備良好的科研能力,有在相關領域發(fā)表過論文者優(yōu)先;
6、具備良好的邏輯思維能力和問題解決能力,能夠獨立分析和解決復雜問題;
7、有實際應用強化學習算法解決復雜問題的經(jīng)驗,如游戲、機器人控制、自動駕駛等;
8、具備良好的團隊合作精神和溝通能力,能夠與不同部門有效協(xié)作;
9、對技術創(chuàng)新有熱情,愿意不斷學習新知識,適應快速變化的技術環(huán)境。
【公司亮點】:
國企背書、發(fā)展穩(wěn)定、五險一金、月度補貼、企業(yè)年金、法定假期、項目獎金、年終獎金