(此崗位為外包崗位)
崗位職責:
1.熟悉業界主流框架的部署與集成,完成在自研異構芯片上的接入調試;
2.負責自研AI框架(含訓練/推理引擎)的架構設計、核心模塊開發及性能調優;
3.熟悉分布式并行基礎原理,配合軟硬件進行分布式訓練推理策略的制定;
4.主導AI框架與自研芯片(GPU/NPU等)的軟硬件協同設計,通過編譯器優化(如圖優化、算子融合、內存調度)提升計算效率。
崗位要求:
1.具備框架開發相關工作經驗,從事過AI框架研發項目者優先;
2.深入了解主流大模型知識以及分布式訓推技術((Megatron-LM、DeepSpeed));
3.了解AI編譯器技術棧(MLIR/LLVM),掌握圖優化、算子融合、多面體優化等編譯加速方法優先;
4.有異構芯片(GPU/NPU)開發經驗:熟悉CUDA/OpenCL編程優先;
5.有良好的學習能力、溝通能力和團隊合作能力,工作態度端。