日日噜夜夜草|一级黄色录像高清版|调教白富美加勒比久久|亚洲欧洲精品婷婷|日韩综合无码色色|日韩精品一区妖精视频|亚洲无码中文字幕hd|99亚洲思思丝袜|手机看片国产精品大胆亚洲|成人无码视频一区二区在线播放

更新于 8月21日

大模型訓(xùn)練工程師(教育OCR識別與評分方向)

1.2-2.4萬
  • 成都武侯區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招2人

職位描述

自然語言處理圖像算法人工智能
崗位職責
  1. 負責搭建和優(yōu)化大模型訓(xùn)練環(huán)境,包括硬件資源配置(GPU/TPU 集群)、分布式訓(xùn)練框架部署(如 PyTorch Distributed、DeepSpeed)及訓(xùn)練流程自動化,保障模型高效穩(wěn)定訓(xùn)練。
  2. 主導(dǎo) OCR(光學(xué)字符識別)與智能改卷場景的訓(xùn)練數(shù)據(jù)處理全流程:包括數(shù)據(jù)采集、清洗、標注規(guī)則制定、標注質(zhì)量校驗,構(gòu)建高質(zhì)量結(jié)構(gòu)化訓(xùn)練數(shù)據(jù)集(如手寫體文本、試卷版式、題型標簽等)。
  3. 基于深度學(xué)習與大模型技術(shù),設(shè)計并訓(xùn)練適用于 OCR 的文本檢測、識別模型(如優(yōu)化檢測框精度、手寫體字符識別準確率),以及智能改卷的評分模型(如題型匹配、答案相似度計算、得分規(guī)則建模)。
  4. 負責模型訓(xùn)練過程中的參數(shù)調(diào)優(yōu)、性能監(jiān)控與效果迭代,通過實驗對比(如調(diào)整模型深度、學(xué)習率策略、數(shù)據(jù)增強方法)提升模型在實際場景中的魯棒性(如復(fù)雜版式試卷、潦草手寫體的識別效果)。
  5. 與算法研發(fā)、產(chǎn)品落地團隊協(xié)作,輸出訓(xùn)練模型的技術(shù)文檔(如訓(xùn)練日志、參數(shù)配置、性能指標),支持模型部署與場景化應(yīng)用驗證。
  6. 跟蹤大模型訓(xùn)練、OCR 技術(shù)及教育場景 AI 應(yīng)用的前沿動態(tài),將新技術(shù)(如小樣本學(xué)習、領(lǐng)域自適應(yīng)微調(diào))落地到實際業(yè)務(wù)中,提升模型效果與效率。
任職要求學(xué)歷與專業(yè)
  • 本科及以上學(xué)歷,計算機科學(xué)、軟件工程、人工智能、自動化、數(shù)學(xué)等相關(guān)專業(yè);碩士學(xué)歷優(yōu)先,有相關(guān)領(lǐng)域研究經(jīng)歷者優(yōu)先。
技能要求
  1. 編程語言:熟練掌握 Python,具備扎實的代碼功底,能獨立編寫數(shù)據(jù)處理、模型訓(xùn)練腳本;了解 C++ 者優(yōu)先。
  2. 深度學(xué)習框架:精通至少一種主流深度學(xué)習框架(PyTorch/TensorFlow),熟悉模型構(gòu)建、訓(xùn)練 API 的使用,能獨立搭建自定義網(wǎng)絡(luò)結(jié)構(gòu)。
  3. 大模型訓(xùn)練能力:具備大模型(如 LLM、視覺 - 語言多模態(tài)模型)訓(xùn)練或微調(diào)經(jīng)驗,熟悉分布式訓(xùn)練原理,能獨立配置分布式訓(xùn)練環(huán)境并解決訓(xùn)練中的常見問題(如梯度爆炸、節(jié)點通信超時)。
  4. 數(shù)據(jù)處理能力:掌握數(shù)據(jù)處理工具(如 Pandas、NumPy、OpenCV),熟悉數(shù)據(jù)標注流程與工具(如 LabelStudio、CVAT),能設(shè)計標注規(guī)則并處理非結(jié)構(gòu)化數(shù)據(jù)(圖像、文本)的清洗與格式轉(zhuǎn)換。
  5. OCR 與機器學(xué)習基礎(chǔ):
    • 理解 OCR 技術(shù)核心原理(如文本檢測算法:YOLO、EAST;文本識別算法:CRNN、ViT-OCR),有 OCR 模型訓(xùn)練或優(yōu)化經(jīng)驗者優(yōu)先;
    • 掌握機器學(xué)習基礎(chǔ)理論(如損失函數(shù)設(shè)計、優(yōu)化器原理、過擬合抑制方法),能基于業(yè)務(wù)場景設(shè)計模型評估指標(如 OCR 準確率、改卷評分一致性)。
  6. 工程能力:具備良好的問題排查能力,能通過日志分析定位訓(xùn)練過程中的硬件、框架或數(shù)據(jù)問題;了解 Linux 系統(tǒng)操作,能編寫 Shell 腳本或自動化工具提升訓(xùn)練效率。
經(jīng)驗要求
  • 1-3 年及以上大模型訓(xùn)練、深度學(xué)習算法開發(fā)或 OCR 相關(guān)項目經(jīng)驗;有教育場景(如試卷識別、智能批改)AI 模型訓(xùn)練經(jīng)驗者優(yōu)先。
  • 有實際分布式訓(xùn)練項目經(jīng)驗(如百萬級樣本量、百億參數(shù)模型訓(xùn)練),或主導(dǎo)過數(shù)據(jù)標注體系搭建項目者優(yōu)先。
軟技能
  • 具備較強的邏輯思維與實驗設(shè)計能力,能通過系統(tǒng)化實驗分析問題并提出優(yōu)化方案。
  • 良好的溝通協(xié)作能力,能清晰表達技術(shù)思路,與跨團隊高效配合推進項目。
  • 具備自驅(qū)力與學(xué)習能力,能快速適應(yīng) AI 技術(shù)迭代,主動探索解決復(fù)雜業(yè)務(wù)問題的方法。
加分項
  1. 發(fā)表過大模型訓(xùn)練、OCR 技術(shù)相關(guān)的學(xué)術(shù)論文,或有 Kaggle 等算法競賽獲獎經(jīng)歷。
  2. 熟悉大模型領(lǐng)域自適應(yīng)微調(diào)技術(shù)(如 LoRA、QLoRA),或有小樣本場景下模型訓(xùn)練經(jīng)驗。
  3. 了解教育行業(yè)業(yè)務(wù)(如試卷結(jié)構(gòu)、考試評分規(guī)則),或有手寫體識別、版式分析相關(guān)項目經(jīng)驗。
  4. 掌握模型壓縮、量化技術(shù),能在保證精度的前提下優(yōu)化模型推理速度。

工作地點

成都市武侯區(qū)長華路19號萬科匯智中心1701

職位發(fā)布者

楊軍/總監(jiān)

三日內(nèi)活躍
立即溝通
公司Logo成都興唐信息技術(shù)有限公司
百年大計,教育為本。時代的發(fā)展離不開教育的興盛,社會的進步依托于教育的革新,強國與興業(yè)亦基于教育的進步!2007年,專注于助力教育事業(yè)發(fā)展的成都興唐信息技術(shù)有限公司應(yīng)運而生,總部坐落于成都高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)的興唐技術(shù),歷經(jīng)十年發(fā)展,已經(jīng)成長為集教育科技產(chǎn)品研發(fā)、銷售、服務(wù)于一體的國家級高新技術(shù)企業(yè)?;厥走^往,成長歷程的艱辛與歡笑歷歷在目,面對著“創(chuàng)新、競爭、遠瞻”的營運法則和激烈的市場競爭,興唐技術(shù)始終堅持“以市場為導(dǎo)向,以技術(shù)求發(fā)展”的經(jīng)營理念革故鼎新,以其獨特的視角,高位求進,準確定位,在2011年成功進行了企業(yè)的轉(zhuǎn)型升級,走上自主研發(fā)的道路,拉開了為客戶提供個性化產(chǎn)品和服務(wù)的帷幕,全面提升企業(yè)核心競爭力和持續(xù)盈利能力。在十年成長的歷程中,興唐技術(shù)始終遵照“基于云計算和教育大數(shù)據(jù)分析云平臺”的發(fā)展戰(zhàn)略闊步前行,通過吸納人才,整合技術(shù)、社會資源,企業(yè)通過了國家級高新技術(shù)企業(yè)認證并獲得政府專項資金扶持。在資金實力、人才實力和技術(shù)實力的強大推力作用下,企業(yè)十年來成功研發(fā)教育質(zhì)量綜合評價系統(tǒng)、教師發(fā)展管理系統(tǒng)、學(xué)業(yè)質(zhì)量監(jiān)測與評價系統(tǒng)、網(wǎng)上閱卷系統(tǒng)、中考網(wǎng)絡(luò)應(yīng)用服務(wù)平臺、民主測評綜合管理系統(tǒng)、企業(yè)辦公OA系統(tǒng)等多項科技產(chǎn)品,成長為川內(nèi)乃至全國基于云計算和教育大數(shù)據(jù)云平臺行業(yè)的標志性企業(yè)。面對成績,興唐人并沒有失去繼續(xù)努力的方向和動力,而是始終堅持“以客戶需求為導(dǎo)向、以客戶滿意為目的、以科技創(chuàng)新求發(fā)展、以互惠共贏促提高、以協(xié)調(diào)發(fā)展創(chuàng)品牌、以優(yōu)質(zhì)企業(yè)報社會”的企業(yè)目標,發(fā)揚“科技強國、興唐己任”的企業(yè)精神,時刻不忘提醒自身審視不足,找準策略,為中國教育改革提供理念和大數(shù)據(jù)分析支撐,為中國的教育研究和改革保駕護航。十年的努力,企業(yè)研發(fā)的產(chǎn)品屢獲殊榮,通過了ISO9001質(zhì)量管理體系認證、ISO14001環(huán)境管理體系認證、GB/T29490-2013知識管理體系認證、取得了多項軟件著作權(quán)證書,成為中國AAA級誠信企業(yè)、四川省軟件協(xié)會理事會員單位,為興唐未來的騰飛奠定了堅實的基礎(chǔ)。在企業(yè)成立十年之際,興唐人將給教育界一份厚重的獻禮——“學(xué)唐云”,學(xué)唐云是以教務(wù)管理、學(xué)生發(fā)展管理、教師發(fā)展管理為核心的教育綜合管理平臺。它的出現(xiàn)必將成為教育系統(tǒng)教學(xué)工作和德育工作的理念引領(lǐng)者和管理好幫手,也將成為我們基于云計算的教育大數(shù)據(jù)分析平臺。展望未來,興唐技術(shù)將以網(wǎng)上評卷系統(tǒng)和學(xué)業(yè)質(zhì)量測評系統(tǒng)兩只“數(shù)據(jù)抓手”向?qū)W唐云導(dǎo)入大量數(shù)據(jù)和流量,憑著對卓越產(chǎn)品的不斷追求,創(chuàng)新進取,依靠強大的技術(shù)實力、誠信的服務(wù)理念和優(yōu)秀的產(chǎn)品性能,持之以恒,打造興唐教育生態(tài)圈,成長為中國最值得信賴的教育信息化專家!
公司主頁