更新于 今天

大模型推理加速工程師

面議
  • 北京西城區
  • 西便門
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

大模型
崗位職責:
1、大模型推理開發:圍繞公司核心AI產品,如AI+實名認證、AI+深度鑒偽、AI+風險目標審核、AI+視覺文檔風控等,負責大模型的服務化工作,包括模型部署、模型服務開發,以維護和更新; 2、訓練與推理加速:負責大模型的訓練與推理加速工作,利用裁剪、量化、蒸餾等技術,加速及優化模型的推理效率,提升吞吐量,并解決推理性能瓶頸。
任職資格:
1、碩士研究生及以上學歷,計算機及相關專業,具備五年以上相關工作經驗; 2、編程語言與技能?:精通C++、Python、Go等編程語言,熟悉CPU/GPU架構與工作原理,有深度學習系統研發經驗,熟悉CUDA編程; 3、深度學習框架:熟悉主流深度學習框架如PyTorch、TensorFlow、PaddlePaddle等?; 4、大模型加速優化工作經驗:具有量化、剪枝、蒸餾等模型推理加速優化的工作經驗者優先;掌握AI加速技術如TensorRT、TVM、VLLM等工作經驗者優先 5、其他:具備快速學習能力和團隊合作精神。

工作地點

北京西城區博瑞琪大廈

職位發布者

張亦佳/中移金科

今日活躍
立即溝通
公司Logo中移金科公司標簽
Play Video中移動金融科技有限公司(簡稱中移金科)是中國移動的全資子公司,立足于打造具有運營商特色的金融、電商新生態,做國內一流的“通信+消費+金融”綜合服務商。融合支付板塊:作為中國移動集團對外支付能力合作的專業主體,承擔以號碼為核心,以和包為主體的融合支付體系的統一建設和運營職責,做融合支付打造者。特色電商板塊:作為中國移動集團積分和電商對外合作的專業主體,承擔全集團積分和電商的統一運營和相關平臺的統一建設職責,做特色電商運營者。金融科技板塊:作為中國移動集團對外提供互聯網金融服務唯一專業主體,承擔互聯網金融業務統籌、合作、創新、運營及相關平臺統一建設職責,做金融科技開拓者。
公司主頁
久久久久国产一级毛片高清板