Python爬虫工程师
广州特道信息科技有限公司
- 公司规模:50-150人
- 公司性质:民营公司
- 公司行业:计算机软件
职位信息
- 发布日期:2020-03-18
- 工作地点:广州
- 招聘人数:2人
- 工作经验:1年经验
- 学历要求:大专
- 职位月薪:6.5-8千/月
- 职位类别:软件工程师
职位描述
岗位职责:
1、负责分布式网络爬虫系统及数据库的设计与开发;
2、设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码等难点
3、维护和优化已有的爬虫服务
4、负责爬虫核心算法的策略优化研究,充分利用资源,提升网页抓取的效率和质量
任职要求:
1、全日制计算机相关专业,有实际工作经验1年或以上;
2、熟练使用Python,有良好的编码习惯。
3、熟悉Linux操作系统,熟练使用常用命令。
4、至少熟悉一种常用数据库:Mysql / MongDB / Redis。
5、熟练使用 requests、urllib模块
6、熟悉各种反爬机制和解决措施 (模拟请求头、设置 IP 代理、cookies, 字体反爬、js混淆加密等)
7、精通网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息
8、熟悉Scrapy、Pyspider等主流爬虫框架使用;
9、有微信、微博相关数据爬取经验优先
10、能独立开发爬虫项目,具有自主解决问题能力
公司介绍
广州特道信息科技有限公司成立于2016年3月,以人工智能为主营业务和主要研发方向,团队在大数据采集、大吞吐量数据集中、跨集群数据处理、数据分析、数据挖掘、可视化、人脸识别、物体识别、音视频分析等技术上都有大量完全自主的知识产权以及市场应用。核心技术团队成员来自多个国际顶尖院校和知名软件技术公司,目前已积累知识产权100多项。
公司拥有1000台服务器的研发设备支撑,拥有完善的大数据运营环境;其中高端服务器占比超过30%;同时具备以***全同步集群,在安全性、可靠性上做了***程度地部署。公司通过自主研发的一站式数据存储和数据分析为一体的完整平台,完全弥补大数据存储分析时对资源整合的空白。
公司目前处于迅速崛起阶段,一直坚持以高新技术为实体,以诚信、服务至上思维为方向。在为实现企业信息化的过程中,同时实现了自身的价值的提升,取得与合作方***程度的双赢局面。
不忘初心、方得始终——未来,特道将走市场化发展道路,继续保持技术领先、用户认可的核心优势,引领国产数据库和AI核心算法的发展。
公司愿景
- 业界领先的人工智能核心技术,涉及计算机图像,语音和自然语言处理等领域
- 高效连结算法和应用场景,“算法为王,场景落地”
- 构建完整ABCD生态圈,A - 人工智能,B - 大数据,C - 云计算, D - 企业级软件开发
公司拥有1000台服务器的研发设备支撑,拥有完善的大数据运营环境;其中高端服务器占比超过30%;同时具备以***全同步集群,在安全性、可靠性上做了***程度地部署。公司通过自主研发的一站式数据存储和数据分析为一体的完整平台,完全弥补大数据存储分析时对资源整合的空白。
公司目前处于迅速崛起阶段,一直坚持以高新技术为实体,以诚信、服务至上思维为方向。在为实现企业信息化的过程中,同时实现了自身的价值的提升,取得与合作方***程度的双赢局面。
不忘初心、方得始终——未来,特道将走市场化发展道路,继续保持技术领先、用户认可的核心优势,引领国产数据库和AI核心算法的发展。
公司愿景
- 业界领先的人工智能核心技术,涉及计算机图像,语音和自然语言处理等领域
- 高效连结算法和应用场景,“算法为王,场景落地”
- 构建完整ABCD生态圈,A - 人工智能,B - 大数据,C - 云计算, D - 企业级软件开发
联系方式
- 公司地址:地址:span东方文德广场