崗位職責:
大模型研發與優化:
1、負責大模型(如Deepseek、Qwen、Llama等)的訓練、微調、蒸餾、優化與調參工作,確保模型在業務場景中的高性能和可擴展性。
2、持續跟蹤學術界和工業界的大模型前沿技術,結合公司業務需求,引入先進算法并進行創新性改進。
場景落地與定制化開發:
1、針對客戶的具體業務場景,進行大模型的定制化開發和場景落地,確保模型能夠有效解決客戶的痛點問題。
2、設計并開發基于大模型的智能化解決方案,提升客戶業務效率。
系統集成與部署:
1、負責大模型與現有業務系統的集成與部署,確保模型能夠無縫嵌入到客戶的生產環境中。
2、優化模型推理性能,確保模型在高并發、大規模數據場景下的高效運行。
數據處理與特征工程:
1、處理大規模、多源異構數據,進行數據清洗、特征提取和特征工程,提升模型的預測能力。
2、設計并實現高效的數據處理流程,確保數據質量和可用性。
團隊協作與技術指導:
1、與產品經理、AI應用工程師、算法工程師、開發工程師等跨部門協作,確保項目按期交付。
2、指導其他工程師,分享技術經驗,提升團隊整體技術水平。
文檔撰寫與知識沉淀:
1、撰寫技術文檔和開發手冊,確保項目的可維護性和可擴展性。
2、定期進行技術分享,總結經驗教訓,推動團隊技術能力的持續提升。
任職要求:
1、教育背景:計算機科學、人工智能、機器學習、數據科學等相關領域的碩士或博士學歷,具備扎實的理論基礎。
2、技術經驗:5年以上大模型或深度學習相關研發經驗,具備豐富的模型訓練、優化和調參經驗。
3、熟悉主流的大模型架構(如Deepseek、Qwen、BERT、Transformer等),具備實際項目落地經驗。
4、熟練使用深度學習框架(如PyTorch、TensorFlow等),具備大規模分布式訓練經驗者為佳。
5、數據處理能力:具備大規模數據處理經驗,熟悉數據清洗、特征工程、數據擴增等技術。熟悉主流數據庫和大數據處理工具(如Hadoop、Spark等)者為佳。
6、編程能力:精通Python,熟悉C++、Java等編程語言,具備良好的代碼編寫和調試能力。
7、具備大型軟件項目開發經驗,熟悉軟件開發流程和工具(如Git、CI/CD等)。
8、業務理解:具備較強的業務理解能力,能夠快速理解央企的業務需求,并將其轉化為技術解決方案。
9、有采購領域相關項目背景者為佳。
10、軟技能:具備良好的溝通能力和團隊協作精神,能夠與不同背景的團隊成員有效合作。具備較強的學習能力和創新意識,能夠快速掌握新技術并將其應用到實際項目中。