数据采集工程师
深圳广田云万家科技有限公司
- 公司规模:150-500人
- 公司性质:外资(欧美)
- 公司行业:家居/室内设计/装潢
职位信息
- 发布日期:2017-04-11
- 工作地点:深圳-罗湖区
- 招聘人数:若干人
- 工作经验:1年经验
- 学历要求:本科
- 职位月薪:1-1.2万/月
- 职位类别:数据库工程师/管理员
职位描述
职位描述:
职位描述:
1. 研究网页特点和规律,对网页信息进行分类、抽取、数据清洗、存储结构等研发和优化工作;
2. 负责领域知识的定向爬取、深度提取和挖掘;
3. 对数据进行清洗、整理、去重及合并等工作。
职位要求:
1.熟悉网页爬取原理及技术,熟悉深度抓取、动态网页抓取技术、熟悉请求伪装,模拟登陆,代理应用,爬虫和反爬技术;
2.精通正则表达式、Javascript、HTTP协议、HTML,善于从各种结构化和非结构化数据中抽取有用的信息;
3.熟悉http client、netty、ajax、htmlunit、Nutch、selenium、HtmlParser、Jsoup、XPATH等技术;
4.熟练多线程技术、网络编程技术、自然语言处理、信息检索、机器学习等相关优势经验者优先;
5.熟悉关系型数据库和非关系型数据库。
举报
分享
职位描述:
1. 研究网页特点和规律,对网页信息进行分类、抽取、数据清洗、存储结构等研发和优化工作;
2. 负责领域知识的定向爬取、深度提取和挖掘;
3. 对数据进行清洗、整理、去重及合并等工作。
职位要求:
1.熟悉网页爬取原理及技术,熟悉深度抓取、动态网页抓取技术、熟悉请求伪装,模拟登陆,代理应用,爬虫和反爬技术;
2.精通正则表达式、Javascript、HTTP协议、HTML,善于从各种结构化和非结构化数据中抽取有用的信息;
3.熟悉http client、netty、ajax、htmlunit、Nutch、selenium、HtmlParser、Jsoup、XPATH等技术;
4.熟练多线程技术、网络编程技术、自然语言处理、信息检索、机器学习等相关优势经验者优先;
5.熟悉关系型数据库和非关系型数据库。
职能类别: 数据库工程师/管理员
公司介绍
我们是广田集团(股票代码:002482)旗下品牌过家家装修网,总部位于广田集团盛华大厦。
借助广田集团20年的住宅精装修优势,以设计、施工管理、供应链为基础平台,与互联网技术、现代IT技术、VR虚拟现实增强技术结合,打造场景化的电子商务平台,与用户进行线上线下的互动,提供“所见即所得”的、免费DIY快速设计、App远程施工监管等“尖叫点”服务,重构“不将就”的家装商业生态圈,为年轻人提供“过家家”式的家装消费体验。
我们期待优秀的您加入!
借助广田集团20年的住宅精装修优势,以设计、施工管理、供应链为基础平台,与互联网技术、现代IT技术、VR虚拟现实增强技术结合,打造场景化的电子商务平台,与用户进行线上线下的互动,提供“所见即所得”的、免费DIY快速设计、App远程施工监管等“尖叫点”服务,重构“不将就”的家装商业生态圈,为年轻人提供“过家家”式的家装消费体验。
我们期待优秀的您加入!