崗位職責:
1、負責DeepSeek等大模型應用的項目落地和價值回收,與其他團隊合作,將大模型應用于實際業務場景,開發智能應用。
2、負責高質量數據集的構建,進行數據清洗、標注和預處理,保障數據質量。
3、運用分布式訓練技術,高效訓練大模型,優化訓練流程,降低訓練成本。
4、深入研究前沿算法,設計并開發先進的大模型架構,提升模型性能與功能。
5、密切關注行業動態,探索新算法、新技術,為公司大模型發展提供技術儲備。
崗位要求:
1、計算機科學、數學、統計學、人工智能等相關專業,本科及以上學歷,3年以上相關工作經驗。具備扎實的專業理論基礎,熟悉機器學習、深度學習等相關知識體系。
2、精通 Python、PyTorch 或 TensorFlow 等深度學習框架,具備豐富的實踐經驗。熟練掌握機器學習、深度學習算法,如 Transformer、BERT、GPT 等。熟悉數據處理、模型訓練、調優和評估的方法與技巧,具備解決復雜技術問題的能力。
3、具備良好的編程習慣和代碼規范,能夠編寫高效、可維護的代碼。熟練掌握數據結構與算法,具備較強的算法實現能力。熟悉 Linux 操作系統,掌握常用的命令和工具。
4、擁有大模型相關的項目經驗,熟悉模型研發全流程者優先。參與過大規模數據集處理、模型訓練和優化工作,有實際應用成果者更佳。具備將模型應用于業務場景,解決實際問題的能力。
5、具備創新思維,能夠主動探索新技術、新方法。擁有快速學習能力,能夠緊跟行業發展趨勢,不斷提升自己的技術水平。善于總結經驗教訓,將所學知識應用于實際工作中。
6、具備良好的團隊協作精神,能夠與不同背景的人員有效溝通。善于傾聽他人意見,積極參與團隊討論,共同解決問題。具備較強的責任心,能夠承擔工作壓力,按時完成任務。
7、有鋼鐵行業算法模型落地經驗者優先。