職位描述
基礎研發平臺是美團的核心技術平臺,立足于“零售+科技”的戰略定位,通過打造人工智能、大數據、云計算、安全等核心技術能力,以及研發效能平臺、企業應用平臺等公共服務,為業務提供穩定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發和探索;能夠接觸超規模集群、海量數據,挑戰高復雜業務場景,有機會與業界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續向社區貢獻業界實踐,加速行業技術發展;我們有完善的互聯網學習生態圈,重視底層邏輯和方法論,助力職業生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發展,創造行業價值。
崗位職責
負責LLM大模型評測算法的研究以及評測模型的訓練、優化,具體工作內容包括但不限于:
1. 深入理解大規模語言模型的模型結構、訓練過程以及評測方案,根據模型的訓練過程以及評測結果,對大語言模型存在的問題和評測存在的問題進行研究,根據研究結果進行優化落地。
2. 深入分析模型評測結果中不符合認知的異常,根據具體的異常制定完善的研究策略,通過對比、歸納等方法,產出研究分析結論,指導模型訓練優化。
3. 構建Data-Centric的數據-訓練-評測閉環,探索研究大模型的數據、模型結構、評測策略、評測數據等對模型評測效果的影響,得出有效認知,指導模型訓練和評測方案的建設。
4. 追蹤大模型方向的前沿進展,積極主動地學習和探索新數據分析、模型訓練以及模型評測方法。
5. 與各相關部門保持良好溝通,深度參與大模型預訓練、SFT、RLHF和評測等階段,共同推動大模型持續優化。
崗位基本需求
1. 碩士及以上學歷,計算機、數學、統計學或相關專業;
2. 熟悉Java/Python/C++等編程語言,良好的編碼習慣和一定的工程能力
3. 具有機器學習或深度學習算法的基礎知識,熟練掌握自然語言處理、多模態或大模型相關算法和模型;
4. 良好的溝通能力、團隊合作精神以及較強的問題解決能力。
5. 對每一行代碼負責,對業務方負責,具備工匠精神。
具備以下者優先
1.有Kaggle等平臺機器學習比賽獲獎經驗者優先。
2. 在計算機領域頂會(如ACL、EMNLP、NeurIPS、AAAI等)上以一作發表過論文者優先;
3. 具備從事相關行業人工智能開發、算法研究等相關工作經驗者優先;
4. 對ChatGPT等相關大模型有深入了解或豐富的使用經驗者優先;
崗位亮點
1. 緊跟人工智能行業進展,接觸到前沿技術和行業趨勢,磨練出對人工智能的獨到見解;
2. 參與AI模型的訓練與評測流程,了解從理論到工程實踐的全面技能;
3. 與一流的人工智能團隊合作,快速成長,提升自身能力;
4. 有機會參與公司的創新項目,跨足不同領域,拓寬人工智能技術的應用范圍;