崗位職責:
1. Python開發,負責系統功能模塊設計、編碼與調試,保障項目高效穩定交付。
2. 支持視覺大模型的應用場景開發,包括但不限于圖像生成、目標檢測、人臉識別、圖像分割與視頻分析。
3. 探索多模態融合技術,將視覺模型與其他模態(如文本、音頻)結合,實現跨模態任務。
4. 挖掘和研發視頻標簽搜索, 視頻剪輯等基于AI的視頻算法并落地
5. 基于RAG構建并優化相關應用系統,提升數據利用與內容生成的精準性和效率。
6. 編寫、優化提示詞策略,引導大模型輸出符合需求的結果,提升人機交互效果。
任職要求:
1. 教育背景:
計算機科學、人工智能、數學等相關專業碩士及以上學歷
2. 技術能力:
精通深度學習框架( PyTorch、TensorFlow)。
熟悉主流視覺或音頻模型(如 Qwen VL、OpenAI Clip、DINOv2、YOLO、Whisper)。
具備扎實的圖像處理、計算機視覺和深度學習理論基礎。
3. 算法與工程經驗:
熟悉圖文/視頻文本多模態建模與應用,在以下領域有深入的研究及落地經驗,包括但不限于:視頻分析理解、RAG、自監督/多模態弱監督,跨模態檢索與生成、AI agent等。
4. 編程能力:
精通Python編程語言。
5. 團隊協作與溝通:自驅力強,具備良好的團隊合作精神,善于溝通交流,能夠與不同崗位的團隊成員緊密協作,共同完成項目目標。
加分項:
1. 有多模態圖文內容生成系統全流程開發經驗者優先(數據采標、數據清洗、模型設計、跨域對齊、提示詞工程)
2. 掌握VUE框架,熟悉前端開發流程,能夠獨立完成前端頁面的開發與優化工作,有實際項目經驗者優先
3. 英文CET-6以上,可以閱讀撰寫英文技術文檔。