薪資范圍:25K-45K/月(能力定薪,優秀者面議)
崗位職責:
1. 設計與開發大語言模型(LLM)后端API接口,支撐億級用戶請求的高并發場景
2. 優化大模型推理服務性能,通過分布式架構、量化壓縮等技術降低服務延遲與成本
3. 構建自動化監控體系,保障接口服務的穩定性(SLA 99.99%)
4. 設計鑒權、限流、負載均衡等安全防護機制,保障企業級服務安全
5. 與算法團隊緊密協作,推動模型版本迭代與接口服務的無縫升級
任職要求核心技能:
- 3年以上后端開發經驗,精通Python/Go/Java中的至少一門語言
- 深入理解RESTful/gRPC接口開發,有高并發服務開發經驗(熟悉FastAPI/Flask/Django框架)
- 熟悉Kubernetes/Docker云原生架構,具備大規模分布式系統調優經驗
- 了解大模型技術棧(如LangChain、vLLM、Triton Inference Server等框架)
- 具備模型服務化經驗者優先(TensorFlow Serving/TorchServe/TRT-LLM等)
加分項:
- 有LLM API商業化落地經驗(如OpenAI API兼容開發)
- 熟悉大模型推理優化技術(動態批處理、持續批處理、PagedAttention等)
- 參與過開源AI項目貢獻或技術社區活躍者