更新于 3月31日

爬蟲數據采集工程師

9000-16000元
  • 北京海淀區
  • 1-3年
  • 本科
  • 全職
  • 招2人

職位描述

數據采集爬蟲開發反爬蟲分布式爬蟲ScrapyDjangoFlask云計算/大數據互聯網計算機軟件
崗位職責:
1. 根據業務需求,研究爬蟲策略和防屏蔽規則,設計和開發分布式爬蟲,支持高并發多平臺抓取;
2. 負責網頁信息抽取、簡單清洗、數據入庫等開發;
3. 提升爬蟲穩定性及可擴展性,充分利用資源,優化爬蟲效率和質量。
任職資格:
1. 計算機軟件及相關專業本科畢業;
2. 1年以上爬蟲項目開發經驗,優秀畢業生亦可;
3. 熟悉爬蟲原理及常見的反爬蟲技術,如cookie、js加密、base64等;
3. 熟練運用python及多進程、多線程開發;
4. 熟練使用scrapy、requests、selenium、pyppeteer等爬蟲包;
5. 熟悉html,正則、xpath等提取技術;
6. 熟悉Mysql、Redis等數據庫及相關操作;
7. 熟悉Linux基礎命令;
8. 有Django/Flask等web框架開發經驗者優先。
職位福利:五險一金、績效獎金、餐補、通訊補助、帶薪年假、補充醫療保險、定期體檢、彈性工作

工作地點

北京海淀區拓爾思集團總部6層

職位發布者

寧姜燕/HRBP

今日活躍
立即溝通
公司Logo拓爾思信息技術股份有限公司
拓爾思信息技術股份有限公司成立于1993年,是中文全文檢索技術的開創者,國內領先的人工智能、大數據和數據安全產品及服務提供商。公司2011年在深圳證券交易所創業板上市,股票代碼300229。公司員工2000多人,在全國設有4大區域中心和31個城市設有分支機構。公司自主研發的產品已被國內外10000家企業級用戶廣泛使用。
公司主頁
久久久久国产一级毛片高清板