上海 [切换城市] 上海招聘

爬虫开发工程师

飞书深诺数字科技(上海)有限公司

  • 公司规模:500-1000人
  • 公司性质:民营公司
  • 公司行业:互联网/电子商务

职位信息

  • 发布日期:2020-11-18
  • 工作地点:上海-长宁区
  • 招聘人数:1人
  • 工作经验:3-4年经验
  • 学历要求:本科
  • 职位月薪:1.5-3万/月
  • 职位类别:爬虫开发工程师

职位描述

岗位职责:

1 负责分布式爬虫架构设计与开发,完成数据采集与爬取、解析处理、入库等数据日常工作

2 负责定向爬取、深度提取,配合数据的清洗、整理、去重及合并等工作

3 监控爬虫进度和预警处理

4 制定防屏蔽规则,提升网页抓取的效率和质量


任职要求:

1 计算机相关专业毕业,2年以上实际爬虫开发经验 

2 熟悉html, javascript, xpath, 正则表达式,beautiful soup等

3 负责反爬虫策略研究,代理IP、模拟登陆, 验证码识别等

4 动态渲染页面爬取, 熟练使用selenium, splash等

5 熟练使用scrapy, scrapy-redis

6 app数据的爬取, 熟练使用抓包工具

7 熟悉各种关系型,非关系型数据库, mysql, mongdb, redis等

职能类别:爬虫开发工程师

公司介绍

飞书深诺集团是中国领先的跨境数字营销机构,是国内***一家同时拥有Facebook、Instagram、Google、YouTube、Twitter、TikTok、Pinterest、Snapchat、LinkedIn九大全球媒体平台官方代理权的跨境数字营销机构。旗下设立飞书互动和深诺互动两家子公司,总部位于上海,北京、深圳、成都均设有分公司,且美国、日本、印度、中东等地均设有办事处。

联系方式

  • 公司地址:地址:span长宁区杨宅路199号东华创意园