日日噜夜夜草|一级黄色录像高清版|调教白富美加勒比久久|亚洲欧洲精品婷婷|日韩综合无码色色|日韩精品一区妖精视频|亚洲无码中文字幕hd|99亚洲思思丝袜|手机看片国产精品大胆亚洲|成人无码视频一区二区在线播放

更新于 4月22日

數(shù)據(jù)工程師(深度學習/大模型方向)

1.5-2.5萬
  • 上海浦東新區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招2人

雇員點評標簽

  • 工作環(huán)境好
  • 同事很nice
  • 團隊執(zhí)行強
  • 人際關系好
  • 氛圍活躍
  • 交通便利
  • 實力大公司
  • 五險一金

職位描述

人工智能云計算/大數(shù)據(jù)
崗位職責 1. 數(shù)據(jù)基礎設施構建 1.1 設計并搭建面向深度學習和大模型訓練的高效數(shù)據(jù)管道(Data Pipeline),支持TB/PB級多模態(tài)數(shù)據(jù)(文本、圖像、語音等)的采集、清洗、存儲與分布式處理。 1.2 優(yōu)化數(shù)據(jù)預處理流程(ETL/ELT),提升數(shù)據(jù)吞吐量與處理效率,滿足大模型訓練對海量數(shù)據(jù)的實時性需求。 2. 數(shù)據(jù)質(zhì)量管理 2.1 開發(fā)數(shù)據(jù)質(zhì)量監(jiān)控工具,識別并修復數(shù)據(jù)噪聲、缺失、偏差等問題,確保訓練數(shù)據(jù)的可靠性。 2.2 建立數(shù)據(jù)版本控制機制,跟蹤數(shù)據(jù)變更歷史,支持模型訓練的可復現(xiàn)性。 3. 分布式數(shù)據(jù)處理 3.1 基于Spark、Flink、Ray等框架構建分布式數(shù)據(jù)處理系統(tǒng),加速數(shù)據(jù)并行與模型訓練效率。 3.2 與算法團隊協(xié)作,優(yōu)化數(shù)據(jù)分片、采樣策略,適配分布式訓練框架。 4. 數(shù)據(jù)合規(guī)與安全 4.1 設計數(shù)據(jù)脫敏、匿名化方案,確保敏感數(shù)據(jù)(如用戶隱私數(shù)據(jù))符合GDPR等法規(guī)要求。 4.2 構建數(shù)據(jù)權限管理體系,實現(xiàn)細粒度訪問控制。 任職要求 1. 精通Python,熟悉SQL及至少一種大數(shù)據(jù)框架(Spark/Flink)。 2. 熟練使用Airflow、Kafka、Dagster等工具構建數(shù)據(jù)工作流。 3. 熟悉數(shù)據(jù)湖(Delta Lake/Iceberg)、向量數(shù)據(jù)庫(Milvus/Pinecone)等新型存儲技術。 4. 理解深度學習數(shù)據(jù)需求:掌握TFDS、HuggingFace Datasets等工具,熟悉數(shù)據(jù)并行/流水線并行邏輯。 經(jīng)驗背景 1. 3年以上數(shù)據(jù)工程經(jīng)驗,至少1年支持過大規(guī)模模型(LLM/CV大模型)數(shù)據(jù)體系建設。 2. 有完整的數(shù)據(jù)治理項目經(jīng)驗,熟悉數(shù)據(jù)血緣追蹤、元數(shù)據(jù)管理(如Apache Atlas)。

工作地點

上海浦東新區(qū)科技領袖之都43號樓

職位發(fā)布者

周蓓麗/人事經(jīng)理

立即溝通
公司Logo浪潮集團公司標簽
浪潮集團是中國領先的云計算、大數(shù)據(jù)服務商,擁有三家上市公司。主要業(yè)務涉及計算裝備、軟件、云計算服務、新一代通信、大數(shù)據(jù)及若干應用場景。作為中國最早的IT品牌之一,浪潮致力于成為世界一流的新一代信息技術龍頭企業(yè)經(jīng)濟社會數(shù)字化轉型的優(yōu)秀服務商,新型基礎設施建設的骨干企業(yè)。
公司主頁