更新于 2月27日

大模型數據工程師

1.5-3萬
  • 北京豐臺區
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

數據治理數據挖掘
崗位職責 1、負責大模型監督微調或強化學習所需數據集的分析、制作、收集等工作,并編制形成標準規范文檔; 2、負責編制數據處理相關過程資料及成果資料; 3、負責數據處理整個過程管理,包括但不限于需求、質量、進度和風險等的全局把控及問題解決; 4、負責支撐保障數據類項目實施工作。 任職資格 1.計算機科學、人工智能、軟件工程、數學、統計學等相關專業,本科及以上學歷; 2.熟練掌握 Python/Shell/SQL,至少精通一門編程語言(如 Java/Scala/C++); 3.熟悉 TensorFlow、PyTorch 等深度學習框架,掌握 Hadoop/Spark 等大數據處理工具; 4.熟練使用常用的深度學習框架,如TensorFlow、PyTorch等; 5.具備數據清洗、數據治理、數據管道設計及自動化流程開發經驗; 6.熟悉自然語言處理(NLP)、機器學習算法,具備模型優化能力(如數據去重、質量評估等); 7.了解大模型預訓練、微調及樣本構建方法,熟悉千億級參數模型的訓練流程; 8.具備數據敏感性,能快速定位數據問題并提出改進方案。 9.良好的跨團隊協作能力,能與算法工程師、業務部門高效配合。 10.對數據質量有高度責任感,持續跟蹤前沿技術(如多模態數據處理)。 加分項: 1.2年以上大模型、NLP 或機器學習相關開發經驗,有數據清洗與模型結合的實際案例優先。 2.具備海量數據處理經驗,熟悉大模型數據需求分析及測試集設計。 3.具有垂直領域的數據治理或模型落地經驗者優先。

工作地點

豐臺區北京豐臺總部基地12區

職位發布者

張雪/人事經理

立即溝通
公司Logo航天科工(北京)空間信息應用股份有限公司
航天科工(北京)空間信息應用股份有限公司(簡稱:航天空間應用公司)是中國航天科工集團有限公司旗下專業從事空間信息應用的高科技企業。公司成立于2001年,是國內最早從事自主知識產權遙感軟件研發的企業,經過20余年的發展,公司產品和服務廣泛應用國防、政府、企業等領域,成為國內一流、以遙感為核心的空間信息應用產品和服務提供商。公司形成了完整的空間信息處理、管理、應用的核心技術和產品體系,擁有發明專利50余項,軟件著作權500余項。時空信息云服務平臺、遙感圖像處理超算平臺等核心產品及關鍵技術處于國內領先、國際一流水平,打通了空間信息存儲、管理、計算、分發、服務全鏈條,成功應用于天基信息支援、戰場環境保障、高分辨率對地觀測國家重大專項、自然資源調查監測、智慧海洋等國家重大科技和工程專項。智慧林草云平臺產品成功應用于山水林田湖草生態修復、生態保護支撐體系、林草生態感知系統等國家重大工程,成為全國20余省、200多個市縣級林草部門的核心平臺,市場占有率行業領先。公司產品應用成效卓越,社會、經濟、生態效益顯著得到了各界的好評,被中央電視臺、新華社等中央媒體廣泛報道。公司擁有一流的人才隊伍,博士、碩士研究生學歷占公司總人數50%以上,平均年齡30歲,富有朝氣與活力,擁有中央軍委科技委專家、國務院特殊津貼專家、北京市“科技新星”、航天科工集團“巾幗建功”、航天系統公司“杰出青年”等領軍人才。公司擁有一流的科技創新能力,承擔國家重大專項、國家重點研發計劃等重大科研項目30余項,擁有北京市企業技術中心、福建省衛星海洋遙感與通訊工程中心、集團空間數據服務中心等多個國家級、省級、行業級創新條件平臺,與國內多所一流-高校、研究所共建有聯合實驗室、研發中心等,聯合培養研究生、博士后。公司是多個國家標準化管理委員會專委會成員,承擔、參與國家標準、行業標準近20項。科技創新成果卓著,土地調查監測空天地一體化技術開發與裝備研制項目榮獲國家科技進步二等獎,影像高性能處理分析技術等核心技術榮獲省部級科技進步一等獎、二等獎10余項,公司承擔的林草、海洋、環保等項目先后榮獲地理信息優秀工程銀獎、銅獎20余項。公司擁有一流的資質體系,已獲得測繪資質甲級、電子與智能化承包二級、CMMI軟件能力成熟度模型集成、ITSS信息技術服務標準、ISO9001質量管理、ISO27000信息安全管理等20余項資質證書與體系認證,標志著公司具備了測繪地理信息、軟件研發、信息系統集成、信息安全、電子智能化、軍工等多領域綜合資質能力,是國內空間信息應用領域資質體系最全、級別最高、綜合性最強的企業之一。
公司主頁
久久久久国产一级毛片高清板