1、深度參與大語言模型的數據處理、prompt工程、模型訓練、調優、系統評測和模型推理;
2、負責行業大語言模型應用,包括但不限于對話問答、信息提取、文本生成、序列決策等場景幫助團隊達成目標效果和應用落地;
3、針對細分業務場景的數據處理、模型微調、prompt tuning等,以適應場景并達成業務目標;
4、參與設計行業大語言模型的應用方案設計。
任職資格:
1、碩士及以上學歷,計算機類及相關專業優先;
2、熟悉python和常用的算法庫和深度學習訓練框架,有分布式預訓練的經驗,良好的開發能力;
3、了解常用的預訓練模型與技術概念,如Transformer/BERT/GPT/T5/LayoutLM等,有多模態經驗者優先;
4、對NLP主流大模型如GPT3/chatGPT/T5/LLaMA/GLM等的原理和差異有深入的理解和實際項目經驗者優先;
5、有大模型、智能對話、知識圖譜、搜索引擎等工業級系統算法開發實戰經驗者優先;
6、具有自主學習能力和自我驅動力。