崗位職責 :
1. 模型研究與算法驗證
- 負責大語言模型技術研究,主導模型訓練策略優化及性能驗證,提升模型在復
雜場景下的準確性與魯棒性。
- 推進模型微調、量化壓縮、推理加速等技術落地,解決訓練過程中的工程難題
(如分布式并行、內存優化)。
2. 數據與實驗管理
- 構建高質量訓練數據集,設計數據清洗、標注及合成方案,確保數據質量與多
樣性。
- 設計實驗方案并復現前沿模型,通過對比實驗驗證技術路線可行性。
3. 技術落地支持
- 協同團隊完成模型部署與調優,優化推理延遲與吞吐量,支持端側/云端多場景 應用。
- 輸出技術文檔與專利,推動研究成果在智能數據治理、知識治理、文本挖掘、
人機交互等領域的商業化落地。
任職要求:
1. 教育背景
- 計算機科學、人工智能或相關專業碩士及以上學歷,有扎實的數學與算法基
礎。
2. 技術能力
- 精通PyTorch/TensorFlow等框架,熟悉DeepSpeed、LlamaFactory等分布式訓練 工具,掌握模型并行、流水線并行等優化技術。
- 具備強化學習研究經驗,有頂會論文或開源項目貢獻者優先。
3. 工程實踐
- 熟悉Linux系統與Docker或K8s,具備大規模數據處理與模型調優經驗,能獨立解決GPU集群、網絡通信等工程問題。
4. 加分項
- 有數據治理、等垂直領域模型落地經驗者優先。
- 熟悉模型可解釋性分析或自動化評測工具(如BLEU、ROUGE)優先。