爬虫开发工程师
飞书深诺数字科技(上海)有限公司
- 公司规模:500-1000人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2020-11-18
- 工作地点:上海-长宁区
- 招聘人数:1人
- 工作经验:3-4年经验
- 学历要求:本科
- 职位月薪:1.5-3万/月
- 职位类别:爬虫开发工程师
职位描述
岗位职责:
1 负责分布式爬虫架构设计与开发,完成数据采集与爬取、解析处理、入库等数据日常工作
2 负责定向爬取、深度提取,配合数据的清洗、整理、去重及合并等工作
3 监控爬虫进度和预警处理
4 制定防屏蔽规则,提升网页抓取的效率和质量
任职要求:
1 计算机相关专业毕业,2年以上实际爬虫开发经验
2 熟悉html, javascript, xpath, 正则表达式,beautiful soup等
3 负责反爬虫策略研究,代理IP、模拟登陆, 验证码识别等
4 动态渲染页面爬取, 熟练使用selenium, splash等
5 熟练使用scrapy, scrapy-redis
6 app数据的爬取, 熟练使用抓包工具
7 熟悉各种关系型,非关系型数据库, mysql, mongdb, redis等
职能类别:爬虫开发工程师
公司介绍
飞书深诺集团是中国领先的跨境数字营销机构,是国内***一家同时拥有Facebook、Instagram、Google、YouTube、Twitter、TikTok、Pinterest、Snapchat、LinkedIn九大全球媒体平台官方代理权的跨境数字营销机构。旗下设立飞书互动和深诺互动两家子公司,总部位于上海,北京、深圳、成都均设有分公司,且美国、日本、印度、中东等地均设有办事处。
联系方式
- 公司地址:地址:span长宁区杨宅路199号东华创意园