職位描述:
1、支持多模態大模型相關業務應用需求,針對真實場景的用戶需求,設計/創新合理的技術方案,包括單不限于圖像、視頻在內的多模態內容理解,持續研發提升基礎視覺算法能力。
2、探索多模態大模型的高效微調技術和推理技術,保證大模型在業務場景中的快速適配和高效調用。
3、運用大模型支持多元業務需求的快速迭代,始終以優化用戶體驗與提升業務價值為目標。
職位要求:
1、兩年以上圖像處理、計算機視覺方向算法應用和調優相關經驗;
2、在多模態大模型方向有一定經驗,熟悉主流多模態大模型(LLaVA等)的基本原理和訓練方法,對Pre-train、SFT等技術有較深入了解;
3、具備扎實的編程功底,熟悉 Pytorch 等主流深度學習框架,熟練使用 C ++/ Python 等至少一種編程語言,熟悉 Linux 開發環境;
4、對技術有熱情,有良好的溝通表達能力和團隊精神,自驅力強;對大模型應用、圖像識別、用戶意圖識別有深入了解的優先;
5、在頂級會議或期刊上發表過有影響力的學術論文或在重要算法比賽中取得過優秀名次的候選人優先。
6、有大模型相關項目經理或技術團隊牽頭經驗的優先