職位描述
基礎研發平臺是美團的核心技術平臺,立足于“零售+科技”的戰略定位,通過打造人工智能、大數據、云計算、安全等核心技術能力,以及研發效能平臺、企業應用平臺等公共服務,為業務提供穩定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發和探索;能夠接觸超規模集群、海量數據,挑戰高復雜業務場景,有機會與業界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續向社區貢獻業界實踐,加速行業技術發展;我們有完善的互聯網學習生態圈,重視底層邏輯和方法論,助力職業生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發展,創造行業價值。
崗位職責
1. 負責視覺Agent系統的全鏈路設計與開發,構建融合多模態感知、動態決策與自動化執行的視覺智能系統,推動復雜場景下的圖文多模態/視頻理解、交互與生成能力。
2. 負責視覺Agent核心算法的研發與優化,包括但不限于多模態大模型視覺感知、圖像生成、多模態對齊(如文本-圖像-視頻)等方向,持續提升系統的魯棒性與泛化能力。
3. 研發視覺Agent的協作機制,支持多智能體協同任務(如跨模態推理、工具調用),優化模型在實時性、資源效率及長上下文處理中的表現。
4. 研發大模型在業務場景下關鍵能力的應用研發,包括但不限于知識和指令遵循、分析診斷、深度推理、反思和評估等能力的優化和落地。
5. 結合業務場景設計并落地視覺Agent應用,賦能業務智能化升級。
6. 跟蹤計算機視覺與大模型交叉領域的前沿技術,探索創新技術在實際場景中的落地路徑。
崗位基本需求
1. 計算機科學、人工智能、電子工程等相關專業碩士及以上學歷,具有計算機視覺或視覺Agent相關研發經驗。
2. 扎實的算法基礎,熟悉主流視覺模型及多模態大模型,具備模型調優與輕量化部署經驗。
3. 深入理解主流Agent框架原理,在任務規劃、工具調用、策略優化等方向有實際項目經驗;
4. 優秀的分析和解決問題的能力,項目推動力和團隊協作能力。
具備以下者優先
1. 在視覺Agent相關領域發表頂會論文(CVPR/ICCV/ECCV/NeurIPS等)或主導過落地項目。
2. 開源社區貢獻者或重要競賽獲獎者。
3. 具備大模型與視覺技術融合經驗,具有突出的產品建設思維。
崗位亮點
1. 參與美團本地生活場景的視覺智能化革新,直接賦能數億用戶與千萬商家。
2. 探索視覺Agent在生成式AI時代的核心技術,打造行業標桿級應用。
3. 在快速發展的領域中積累經驗,成為大模型和智能體領域的專家。