爬虫开发工程师(Java或Python)
北京可兰德网络技术有限公司
- 公司规模:少于50人
- 公司行业:计算机软件
职位信息
- 发布日期:2020-12-08
- 工作地点:北京-海淀区
- 招聘人数:2人
- 工作经验:1年经验
- 学历要求:大专
- 职位月薪:6-9千/月
- 职位类别:爬虫开发工程师 软件工程师
职位描述
1、在系统工程师或高级程序员的指导下工作;
2、负责互联网数据采集爬虫的开发;
3、调查分析互联网站、网页采集过程出现的问题,定位原因,提出解决思路;
4、互联网站、网页、链接的特征挖掘,进行网页抓取、数据提取、清洗、入库;
5、参与分布式网络爬虫系统开发。
任职要求:
1、1年以上Java或者C#或者Python开发经验,有爬虫开发的实际项目经验;
2、熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;
3、熟悉使用至少一种关系型数据库(MYSQL)等;
4、熟悉一种开源爬虫框架,如scrapy、webmagic、nutch、heritrix等,有开发爬虫框架经验优先;熟悉反爬虫、验证码识 别技术者优先;
5、兼具Python与Java者优先。
公司介绍
可兰德是一家大数据IT服务提供商和内容提供商,主要专注于大数据处理与移动互联网应用、互联网知识库与企业知
识管理、知识与电子商务门户以及移动App等方面的开发和服务。
识管理、知识与电子商务门户以及移动App等方面的开发和服务。
联系方式
- 公司地址:地址:span大连市开发区辽河西路融通大厦507室