更新于 5月30日

python爬蟲工程師

1.5-2.5萬
  • 北京海淀區
  • 中關村
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

Python數據清洗數據挖掘爬蟲開發ScrapyDataStage
我們正在為我們另外一家公司尋找一位優秀的爬蟲工程師,歡迎您的投遞和聯系。 崗位職責: 1、數據爬取:根據業務需求獲取政策法規、行業數據等外部數據; 2、數據清洗與處理:確保數據質量,格式標準化; 3、知識庫構建:構建和維護RAG系統的向量數據庫; 4、數據管道搭建:自動化數據更新和處理流程; 5、數據質量監控:監控數據質量,及時發現和修復問題。 任職要求: 1、技能要求: 數據爬蟲:Python爬蟲框架(Scrapy、BeautifulSoup); 數據處理:Pandas、NumPy等數據處理庫; 向量數據庫:Pinecone、Weaviate、 Supabase Vector等; 數據清洗:文本處理、數據去重、格式標準化; SQL和數據庫:PostgreSQL、數據建模; 爬蟲與數據清洗:Scrapy、BeautifulSoup、Pandas; 數據庫管理:Supabase、PostgreSQL; 數據可視化與監控:Grafana、 Metabase。 2、良好的團隊溝通能力,能將技術方案轉化為業務視角的說明。

工作地點

北京市-海淀區-丹棱街1號B座18層

職位發布者

吳女士/人事經理

三日內活躍
立即溝通
公司Logo北京正合綠勢生態科技有限公司
北京正合綠勢生態科技有限公司(以下簡稱正合綠勢),注冊資金2000萬人民幣。公司順應全國碳市場建設和發展步伐,為各級政府、碳減排企業、重點排放企業及其他碳市場參與方提供核證減排量開發、碳履約、碳交易及碳中和實施路徑等全方位服務。公司自成立以來,憑借著高效卓越的服務水平和穩健務實的經營作風,取得了一系列卓越成績,贏得了客戶的信任和市場的認可,成為國內碳產業綜合服務的主要參與力量。公司主營業務分為三大板塊:一是碳經濟規劃與管理。正合綠勢服務于碳產業鏈上下游,針對不同客戶需求訂制服務方案,同時結合碳金融服務工具,幫助客戶實現碳資產利益最優化及低成本履約。二是碳交易信息服務平臺。圍繞國家核證自愿減排量(CCER)等減排指標,打造中國最具影響力的智慧化碳指標線下撮合交易服務平臺,提升碳交易市場活躍度,幫助市場各參與方實現經濟效益和社會效益的最優化。三是上市公司合作與服務。通過與上市公司合作成立碳基金、幫助上市公司進行碳能力建設、圍繞上市公司主營業務開展“碳中和”轉型及其自身“碳中和”實施路徑等方式,提升上市公司的綜合競爭力和社會影響力。
公司主頁
久久久久国产一级毛片高清板