職位描述:
1、模型架構設計:理解業務場景,參考前沿技術,設計適配的大模型架構,對開源模型按需評估、優化,開發符合場景需求模型。
2、模型開發:運用主流深度學習框架(如 TensorFlow、PyTorch 等),承擔大模型核心編碼,搭建神經網絡,開發從數據處理到分布式訓練流程,保障模型穩定訓練。
3、場景優化:協同業務團隊,依據數據特性優化模型,運用量化、剪枝等手段,平衡精度與成本,適配不同部署環境。
4、項目推進:作為技術主力,規劃項目,協調算法、數據、工程團隊,對接上下游,推動模型落地應用。
5、技術探索:關注前沿動態,調研新技術,參與開源交流,為團隊引入創新點。
任職要求:
1、教育背景:本科及以上學歷,計算機、人工智能等相關專業。
2、專業技能 :熟練掌握至少一種深度學習框架,有 1 - 2 年神經網絡開發經驗,了解常見模型架構優化方法,能搭建、訓練模型。熟悉大規模數據處理基礎,了解分布式訓練,掌握 Python 等編程語言,能利用 GPU 資源訓練模型。
3、問題解決能力:能分析解決模型訓練中的常見問題,如收斂困難、過擬合,有模型優化相關經驗,能應對業務場景挑戰。
4、團隊協作:具備團隊協作精神,能與多團隊溝通協作,理解業務需求,助力項目落地。
5、學習能力:熱愛學習新技術,能緊跟大模型發展趨勢,探索應用于實際項目。
加分項:
1、發表過大模型相關論文或技術文章者優先。
2、參與過開源項目者優先。
3、有跨模態模型開發經驗優先。
4、了解特定行業知識并參與過相關項目優先。