崗位職責(zé)
1. 后端架構(gòu)設(shè)計與開發(fā)
- 負(fù)責(zé)AI產(chǎn)品的后端系統(tǒng)設(shè)計與實(shí)現(xiàn),包括接口服務(wù)、任務(wù)調(diào)度、數(shù)據(jù)流處理
- 支撐大模型調(diào)用、多模態(tài)生成(文本、圖像、音頻、視頻)等功能的穩(wěn)定性與高性能
- 優(yōu)化WebSocket長連接穩(wěn)定性,確保在弱網(wǎng)環(huán)境下的交互體驗(yàn)
2. 模型服務(wù)與優(yōu)化
- 對接主流大模型API(OpenAI、Claude、文心一言、通義千問等),優(yōu)化Prompt策略
- 參與大模型推理優(yōu)化、緩存策略、負(fù)載均衡,降低延遲和推理成本
- 構(gòu)建垂直領(lǐng)域的知識庫(RAG),實(shí)現(xiàn)智能問答系統(tǒng)
3. 數(shù)據(jù)與存儲管理
- 設(shè)計與實(shí)現(xiàn)高效的數(shù)據(jù)存儲方案,支持大規(guī)模用戶生成內(nèi)容的數(shù)據(jù)流轉(zhuǎn)與檢索
- 保證數(shù)據(jù)安全合規(guī),支持多租戶和權(quán)限管理
- 熟悉向量數(shù)據(jù)庫應(yīng)用,支持語義檢索需求
4. 系統(tǒng)性能與穩(wěn)定性
- 構(gòu)建高可用的后端架構(gòu),支持大規(guī)模并發(fā)請求
- 建立監(jiān)控、日志和告警體系,快速定位和解決問題
- 實(shí)現(xiàn)ASR(語音識別)→ LLM(大模型)→ TTS(語音合成)的全鏈路流式交互
5. 跨團(tuán)隊協(xié)作
- 與前端、算法、硬件團(tuán)隊緊密合作,快速迭代產(chǎn)品功能
- 為產(chǎn)品經(jīng)理和業(yè)務(wù)團(tuán)隊提供技術(shù)支持,推動需求落地
任職要求
基本要求
- 本科及以上學(xué)歷,計算機(jī)、軟件工程相關(guān)專業(yè)
- 3年以上后端開發(fā)經(jīng)驗(yàn),精通至少一種主流后端語言(Java / Go / Python / Rust 等)編程語言
- 熟悉后端開發(fā),有Python后端實(shí)戰(zhàn)經(jīng)驗(yàn)
- 熟悉微服務(wù)架構(gòu)和分布式系統(tǒng)設(shè)計
技術(shù)能力
- 熟悉大模型API調(diào)用、RAG(檢索增強(qiáng)生成)技術(shù)
- 熟悉LangChain或類似LLM應(yīng)用框架
- 熟悉常用數(shù)據(jù)庫(MySQL/PostgreSQL/Redis/MongoDB)
- 熟悉云原生技術(shù)(Docker/Kubernetes)、CI/CD流程
- 對性能優(yōu)化、異步任務(wù)處理有深入理解
加分項(xiàng)
- 有AIGC產(chǎn)品經(jīng)驗(yàn),熟悉多模態(tài)生成處理流程
- 有模型推理優(yōu)化、向量數(shù)據(jù)庫相關(guān)經(jīng)驗(yàn)
- 對GPU調(diào)度、模型并行推理有實(shí)踐經(jīng)驗(yàn)
- 有IoT后端開發(fā)經(jīng)驗(yàn),熟悉MQTT協(xié)議、設(shè)備影子等概念
- 有創(chuàng)業(yè)公司背景,能適應(yīng)快速迭代和多任務(wù)環(huán)境
公司福利:
五險一金、周末雙休、法定假日、帶薪年假、包吃包住、員工活動等