爬虫开发工程师
上海居数信息技术有限公司
- 公司规模:50-150人
- 公司性质:合资
- 公司行业:房地产
职位信息
- 发布日期:2019-08-02
- 工作地点:上海-杨浦区
- 招聘人数:1人
- 工作经验:3-4年经验
- 学历要求:大专
- 职位月薪:0.8-1万/月
- 职位类别:高级软件工程师 系统工程师
职位描述
【岗位职责】
1、负责爬虫的设计和开发;
2、负责网页信息抽取技术的研究和开发;
3、设计爬取、调度和抽取算法,优化系统;
4、负责抓取数据的深度提取和挖掘。
【职位要求】
1、计算机或相关专业大专以上学历;
2、要求熟悉Python或JAVA,或者熟悉.NET网络编程;
3、从事过网络爬虫或类似任务的研究开发工作1年以上;
4、精通网页抓取原理及技术的实现细节,熟悉基于规则的网页信息抽取,精通正则表达式,从结构化的和非结构化的数据中获取信息,对网页抓取、信息抽取、去重、清洁有一定经验;
5、有Lucene/Nutch/Heritrix/larbin/HtmlParser等爬虫工具开发经验的优先;
6、有数据挖掘或信息检索开发经验者优先;
7、对开源项目有较好的跟踪和关注,如果对一些开源的做海量数据处理的项目如Redis, MongoDB,MapReduce有经验者会优先考虑。
1、负责爬虫的设计和开发;
2、负责网页信息抽取技术的研究和开发;
3、设计爬取、调度和抽取算法,优化系统;
4、负责抓取数据的深度提取和挖掘。
【职位要求】
1、计算机或相关专业大专以上学历;
2、要求熟悉Python或JAVA,或者熟悉.NET网络编程;
3、从事过网络爬虫或类似任务的研究开发工作1年以上;
4、精通网页抓取原理及技术的实现细节,熟悉基于规则的网页信息抽取,精通正则表达式,从结构化的和非结构化的数据中获取信息,对网页抓取、信息抽取、去重、清洁有一定经验;
5、有Lucene/Nutch/Heritrix/larbin/HtmlParser等爬虫工具开发经验的优先;
6、有数据挖掘或信息检索开发经验者优先;
7、对开源项目有较好的跟踪和关注,如果对一些开源的做海量数据处理的项目如Redis, MongoDB,MapReduce有经验者会优先考虑。
公司介绍
关于居数
居数(中国)信息技术有限公司, 由中国领先的房地产数据机构与资深的产业研究专家团队共同发起,通过海量的房产数据信息的清洗、挖掘、整合和分析,共同为房地产消费者和房地产从业者提供独一无二的中国购房者的消费决策系统平台、房地产信用平台、房地产社区平台、房地产预测平台。
居数(中国)信息技术有限公司,始终以消费者在房地产业的决策消费为市场目标,拥有中国***、最先进的房地产购房决策评测数据库,立足GOOGLE实验室的技术分析水准,为购房者提供决策、评测、买卖的全方位服务分析软件系统和评测网络平台(*****************),打造中国特色的房地产的“大智慧”和“谷歌”。
公司立足移动互联网、房地产、金融三大产业,为员工提供优秀的培训机遇和期权制度,为优秀经理人实现自身梦想提供重要平台
居数(中国)信息技术有限公司, 由中国领先的房地产数据机构与资深的产业研究专家团队共同发起,通过海量的房产数据信息的清洗、挖掘、整合和分析,共同为房地产消费者和房地产从业者提供独一无二的中国购房者的消费决策系统平台、房地产信用平台、房地产社区平台、房地产预测平台。
居数(中国)信息技术有限公司,始终以消费者在房地产业的决策消费为市场目标,拥有中国***、最先进的房地产购房决策评测数据库,立足GOOGLE实验室的技术分析水准,为购房者提供决策、评测、买卖的全方位服务分析软件系统和评测网络平台(*****************),打造中国特色的房地产的“大智慧”和“谷歌”。
公司立足移动互联网、房地产、金融三大产业,为员工提供优秀的培训机遇和期权制度,为优秀经理人实现自身梦想提供重要平台
联系方式
- 公司地址:地址:span周浦康桥