python爬虫工程师
上海兴敬网络科技有限公司
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2019-04-01
- 工作地点:广州-番禺区
- 招聘人数:1人
- 工作经验:2年经验
- 学历要求:招1人
- 语言要求:不限
- 职位月薪:1-1.5万/月
- 职位类别:软件工程师
职位描述
工作职责:
1、 负责设计和开发分布式,多线程网络爬虫应用,包括调度、抓取、入库等内容,进行互联网相关信息的抓取
2、实现海量数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析,整理入库等工作 。
3、设计爬虫策略、防屏蔽规则和功能开发及优化。
4、网页信息抽取等核心算法的研究和优化。
任职要求:
1、计算机相关专业,有2年以上的爬虫开发经验;
2、掌握网络爬虫开发原理,对互联网各种类型数据交互模式熟悉,知道如何处理需登录、验证码、动态网页等各种情况下的数据采集方法。
3、精通html语言,熟悉开源工具,熟悉基于正则表达式、XPath等的信息抽取技术。
4、精通Python语言,熟悉网络编程, 掌握Scrapy、Webmagic、Pyspider等开源框架;
5、熟悉MySql、MongoDB、Elasticsearch一种或多种数据存储工具,有较好的数据库设计能力;。
6、逻辑思维清晰,做事有条理,具备较好的数据分析能力和解决问题的能力。
7、熟悉大数据挖掘、自然语言处理、信息检索、机器学习、web挖掘等搜索引擎等相关经验优先;
8、对反爬技术有丰富经验者优先;
【交通指南】
公司地址:广州市番禺区万达广场B4座,33楼3312-3314(临近万博新村地铁站B出口,直行300米即可到达)
公司介绍
本公司主要从事电子商务,电商推广技术服务,协助商家全方位、多角度的打通全国电子商务销售链,使其在竞争激烈的电子商务市场有效提升销售收入和品牌价值。公司办公地点环境优美,且交通便利。无需外出拓客,写字楼办公。
团队奉行“分红趁早,能者多得”,结果导向的晋升制度和分红机制,只要你有敢拚敢做的态度,只要你有落实执行的能力!我们招募的不仅仅是员工,而是有共同志向的未来合伙人。
【交通指南】
公司地址:昆山市华侨镇中城商务广场4号楼乐釉空间2107室。(临近光明路地铁站2号出口)
团队奉行“分红趁早,能者多得”,结果导向的晋升制度和分红机制,只要你有敢拚敢做的态度,只要你有落实执行的能力!我们招募的不仅仅是员工,而是有共同志向的未来合伙人。
【交通指南】
公司地址:昆山市华侨镇中城商务广场4号楼乐釉空间2107室。(临近光明路地铁站2号出口)
联系方式
- 公司地址:地址:昆山市华侨镇中城商务广场4号楼乐釉空间2107室。(临近光明路地铁站2号出口)