更新于 3月19日

大模型部署與容器化工程師

1.5-1.8萬
  • 天津西青區
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

計算機軟件
辦公地點:熙悅匯附近 核心職責:
  1. 負責RAGFlow、Dify等大模型框架的私有化部署及性能調優(需支持千億級參數模型)
  2. 基于Docker/K8s構建高可用AI服務集群,實現GPU資源動態調度與監控告警
  3. 開發Python中間件對接LangChain/LLamaIndex等工具鏈,優化Token處理效率
  4. 設計模型微調流水線,支持LoRA/QLoRA等輕量化訓練方案
  5. 構建模型服務的A/B測試框架及灰度發布機制
    硬性要求:
  • 計算機/數學專業碩士,2年以上AI工程化落地經驗
  • 精通Python異步編程,熟悉FastAPI/GRPC等高性能框架
  • 熟練使用Kubeflow/Triton等MLOps工具鏈,有vLLM優化經驗者優先
  • 掌握NVIDIA-Docker配置及CUDA核心優化技巧
  • 熟悉大模型量化部署(AWQ/GPTQ)及顯存優化方案

工作地點

天津西青區三五互聯科技園1號樓B座B602

職位發布者

鄭先生/HR

立即溝通
北京順興泰德科技有限公司
北京順興泰德科技有限公司成立于2004年,由北京總公司,天津分公司,醫療事業部分公司組成。我公司主營業務為戴爾電腦全系列產品,兼營醫療器械銷售。公司擁有四家京東店鋪和渠道銷售,年度銷售逐年保持遞增的趨勢。;公司有良好的工作氛圍,暢通的晉升渠道。我們尊重人才,崇尚狼性文化,希望員工每天都為自己的夢想努力奮斗。期待您的加入。
公司主頁
久久久久国产一级毛片高清板