崗位職責:
1.負責大模型、深度學習理論、算法相關的研究工作;
2.探索大規模預訓練模型(不限文本、音頻、圖像)的算法研發和模型訓練等相關工作;
3.探索前沿大模型訓練相關技術的發展,包括但不限于算子優化, 計算劃分與調度、動態重計算、流水線優化等;
4.研究業界最前沿的NLP、視覺、多模態等大模型及相關工程化工作,解決大模型業務落地的事實可靠性、服務性能等相關技術障礙,形成大模型推理/微調服務、AI應用工具鏈等平臺化能力;
5.負責推動項目中大模型的各種落地應用實施。
職位要求:
1.碩士及以上學歷,人工智能、計算機科學與技術等相關專業 ;
2.具有較強的機器學習、深度學習相關技能和算法模型、數據挖掘等相關方向的研究經驗;
3.具有濃厚的前沿新科技探索興趣,具備較強的獨立分析、解決問題的能力,能獨立完成科研工作,在國內外重要學術刊物或重要國際會議(如TPAMI,KDD,NeurIPS,ICML,ICLR,CVPR等)發表過高水平學術論文者優先;
4.具有扎實的數理基礎,對大模型與深度學習的基本原理有透徹的理解;
5.熟悉大規模預訓練模型,有LLM或GPT相關項目(算法或工程均可)落地經驗者優先。