工作職責:
(1)具備從0到1大模型算法部署、推理、微調等人工智能框架能力;
(2)負責對模型進行微調/訓練,包括主流大模型 qwen、glm、deepseek 等和常 見 embeding 模型等;
(3)領銜構建AIGC等領域模型,結合SFT/RLHF方向的前沿算法持續提升業務效果;
(4)大模型微調與優化:使用 LLaMA Factory、Llama.cpp 和 Unsloth 工具對 LLM 進行高效微調,運用 LORA、QLORA 等技術優化模型性能,特別是在資源受限環境中確保高效運作;
(5)掌握RAG檢索增強生成技術,能夠結合醫學知識庫、病例數據實時生成高質量的臨床決策支持系統(CDSS)內容;
(6)使用 Agent 技術構建智能醫療助手系統,能夠自主執行醫療數據分析、患者咨詢、健康管理等任務;
(7)開展對大模型應用落地的技術應用和研究;
任職資格:
(1)自然語言處理、機器學習、人工智能等相關專業;
(2)熟練使用Tensorflow、Pytorch等深度學習框架,扎實的編程基礎,具備獨立的算法實現能力;
(3)具備大模型算法知識,有實際模型的部署、推理、微調、RAG、Agent、AIGC等應用場景經驗者優先;
(4)對大模型推理框架,如 vllm trt-llm 有開發使用經驗者優先;有大模型推理加速優化經驗的優先(量化 蒸餾);
(5)熟悉 Python、C++等編程語言,具備扎實的編程功底;
(6)了解常用的 llm 中間件向量數據庫(milvus pinecone faiss)gpt-cache 以及護欄技術;
(7)有開源項目研發經驗的優先;
(8)責任心強,具備良好的問題分析及解決能力,團隊合作能力;