崗位職責:
1、模型微調:使用預訓練的大語言多模態模型(例如GPT系列),負責設計和實施微調策略,以適應特定任務和數據集。
2、自動化腳本編寫:開發自動化工具和腳本,用于模型微調、數據預處理、實驗管理和結果分析,以提高工作效率并確保實驗的可重復性。
3、測試腳本規劃:設計和編寫用于模型評估和性能測試的腳本,包括功能測試、端到端測試和基準測試。
4、數據處理和清洗:處理和清洗多模態數據,準備用于模型訓練和微調的數據集。
5、算法優化:不斷改進微調過程和模型性能,通過實驗和分析尋找優化策略,提高模型在特定任務上的性能。
6、技術文檔編寫:撰寫技術文檔和報告,記錄實驗結果、方法和發現,以及分享最佳實踐和經驗教訓。
7、團隊協作:與團隊成員合作,包括研發人員、測試工程師和產品經理,共同推動項目進展并解決技術挑戰。
招聘要求:
1、學歷要求:計算機科學、人工智能、機器學習或相關領域的碩士或博士學位。
2、專業技能:具有深度學習和自然語言處理領域的扎實理論基礎和實踐經驗,熟悉常見的神經網絡架構和訓練技術。
3、編程技能:熟練掌握Python編程語言和深度學習框架(如PyTorch或TensorFlow),具有良好的編程實踐和軟件工程能力。
4、經驗要求:至少2年以上相關工作經驗,有大語言模型微調或自然語言處理項目經驗者優先。有智能體和RAG開發經驗,熟悉python。
5、溝通能力:出色的溝通和團隊合作能力,能夠清晰表達想法、分享知識,并與多學科團隊緊密合作。
6、創新精神:具有創新思維和問題解決能力,能夠在復雜的問題上尋找新穎的解決方案。