更新于 今天

大模型算法工程師

1.5-3萬
  • 南京雨花臺區
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

深度學習大模型算法
崗位職責: 1、負責大模型的架構設計與核心代碼開發,提升生產效率和智能化水平; 2、主導模型訓練的分布式架構設計,使用高效的并行計算技術(如數據并行、模型并行)提高訓練效率; 3、深入研究大語言模型(如GPT系列、LLaMA、Transformer等)核心技術,并結合業務需求完成模型的定制化優化; 4、解決大規模訓練中的性能優化問題,包括模型參數壓縮(如量化、剪枝)、顯存優化(如ZeRO優化、DeepSpeed)和推理加速; 5、實現和優化基于LangChain、RAG(檢索增強生成)等框架的業務場景應用,確保高效的知識檢索與動態生成能力; 6、負責核心代碼開發,設計和實現訓練與推理模塊的核心算法與功能; 7、跟蹤大模型領域的前沿技術動態,調研并引入最新的技術方法,推動創新和技術落地; 8、指導團隊技術開發,解決技術難點,保障項目按時高質量交付。 任職要求: 1、本科及以上學歷,計算機、人工智能等相關專業,3-5年以上算法工作經驗,有模型項目落地經驗。 2、熟練掌握 Pvthon、java 等常用編程語言之一,有良好的數據結構與算法基礎、具備扎實的編程功底,熟悉 Git 代碼管理。 3、精通大模型的核心技術,包括 Transformer 架構、預訓練與微調技術、指令微調(SFT)、RLHF(基于人類反饋的強化學習)等。 4、熟悉分布式訓練技術,掌握 Tensor Parallel、Pipeline Parallel等優化方法,能夠處理大規模模型的多節點訓練。 5、具備深度學習框架(如 PyTorch、TensorFlow)上的豐富開發經驗,能夠獨立完成從模型設計到部署的全流程開發。 6、熟悉 GPU/TPU 加速技術、CUDA 編程,以及 DeepSpeed 等框架的高效訓練與推理方法。 7、掌握基于向量檢索的知識增強生成(RAG)技術,熟悉LangChain 等工具的應用與擴展。 8、優秀的代碼開發能力,能夠實現高質量、高性能的核心算法和模塊, 9、能夠協調和指導團隊成員,解決技術瓶頸,推動項目進展。 加分項: 熟悉大模型在特定垂直領域(如電力)的應用場景。 具備多模態建模經驗(如文本、圖像、視頻的聯合建模)。 掌握矢量數據庫(如 Pinecone、Weaviate)以及分布式存儲技術的實際使用經驗。 有較強的代碼能力,有高質量的中大型項目或個人開源項目的經驗。

工作地點

雨花臺區中國(南京)軟件谷云密城D棟

職位發布者

余婷/人事專員

昨日活躍
立即溝通
公司Logo南京鼐云科技股份有限公司
鼐云科技,一家致力于通過數字孿生可視化產品,以虛實交互、場景映射的方式賦能智慧城市生態建設的綜合方案商。我們以數字化的手段觸達關系網,在過程中完善機器學習能力并反哺和支撐全周期的精細化管理。鼐云已在新能源協控系統、雙碳管理、行政執法等數十項大型綜合管控系統中成功應用,獲得業界的肯定及各部門、機構的一致好評,多年的經驗積累讓我們更懂行業。鼐云現為科技型中小企業、高新技術企業,擁有20余項知識產權,獲得ISO、CMMI3、ITSS等多種認證。鼐云作為產業智能化轉型的催化劑,我們發力于城市應急、智慧電網等主要賽道,立足于推動數字經濟和實體經濟的深度融合,豐富和拓展場景的多元化應用,打造行業延展、產業協同的智能化共生新業態,創造無限價值的可能。
公司主頁
久久久久国产一级毛片高清板