職位描述
基礎研發平臺是美團的核心技術平臺,立足于“零售+科技”的戰略定位,通過打造人工智能、大數據、云計算、安全等核心技術能力,以及研發效能平臺、企業應用平臺等公共服務,為業務提供穩定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發和探索;能夠接觸超規模集群、海量數據,挑戰高復雜業務場景,有機會與業界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續向社區貢獻業界實踐,加速行業技術發展;我們有完善的互聯網學習生態圈,重視底層邏輯和方法論,助力職業生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發展,創造行業價值。
崗位職責
1. 深入參與美團 GenAI 大規?;A設施建設
2. 負責美團大規模基座模型訓練框架架構迭代,穩定性、易用性、可運維能力和可觀測能力建設
3. 負責高達數萬卡規模和數萬億參數的大規模訓練性能優化
崗位基本需求
1. 有扎實的計算機理論基礎,熟練掌握C++或Python語言
2. 熟悉CUDA或NPU編程經驗優先,有RDMA實踐經驗優先
3. 深入了解PyTorch 或 TensorFlow等引擎的架構和運行原理,有深度定制經驗優先
4. 有Megatron-LM、DeepSpeed 等大模型訓練框架的優化經驗優先
5. 深入理解大模型訓練多維并行并行架構,如Tensor 并行、流水線并行、序列并行等
6. 深入理解Transformer 類模型結構,如BERT、GPT 、ViT等
7. 學習能力和好奇心強,具備良好的溝通協調能力與團隊協作精神
具備以下者優先
1.有大模型相關算法研究經驗優先,歡迎算法轉工程
2.有大規模分布式系統、高性能網絡研發、高性能計算相關經驗優先
3.業界頭部規模的計算集群,海量數據和豐富的應用場景,挑戰與機遇并存。
崗位亮點
業界前列的算力規模、海量數據和豐富的應用場景,深入協同算法團隊深度參與大模型項目,共同探索Scaling Law 邊界。