数据挖掘工程师
深圳市搜了信息技术有限公司
- 公司规模:少于50人
- 公司性质:民营公司
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2015-07-01
- 工作地点:深圳-南山区
- 招聘人数:1
- 学历要求:大专
- 职位月薪:面议
- 职位类别:软件工程师
职位描述
岗位职责:
1、根据项目需求,实现信息高效采集与正确解析;
2、网络爬虫的策略优化,持续提升网络信息抓取的效率和质量。
岗位要求:
1、计算机、信息管理、软件工程类相关专业,有2年以上工作经验;
2、熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页消重、网页信息抽取两年以上数据挖掘经验;
3、熟悉多线程、多进程、网络通信编程相关知识,了解httpclient、htmlunit等数据抓取工具,熟悉调度系统与爬虫节点通信机制;
4、了解HTTP协议和各种Web前端技术(HTML/JavaScript/AJAX等),精通正则表达式和XPath,能够从结构化和非结构化的数据中获取信息;
5、了解Mysql、Oracle等数据库;
6、具备信息检索、自然语言处理、web挖掘等搜索引擎相关知识;
7、有分布式、电信/电商垂直领域爬虫开发经验优先;
8、思维活跃,具有独立分析和解决问题的能力,工作主动性强,敢于挑战自我;
9、良好的团队合作精神,较强的沟通和学习能力。
1、根据项目需求,实现信息高效采集与正确解析;
2、网络爬虫的策略优化,持续提升网络信息抓取的效率和质量。
岗位要求:
1、计算机、信息管理、软件工程类相关专业,有2年以上工作经验;
2、熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页消重、网页信息抽取两年以上数据挖掘经验;
3、熟悉多线程、多进程、网络通信编程相关知识,了解httpclient、htmlunit等数据抓取工具,熟悉调度系统与爬虫节点通信机制;
4、了解HTTP协议和各种Web前端技术(HTML/JavaScript/AJAX等),精通正则表达式和XPath,能够从结构化和非结构化的数据中获取信息;
5、了解Mysql、Oracle等数据库;
6、具备信息检索、自然语言处理、web挖掘等搜索引擎相关知识;
7、有分布式、电信/电商垂直领域爬虫开发经验优先;
8、思维活跃,具有独立分析和解决问题的能力,工作主动性强,敢于挑战自我;
9、良好的团队合作精神,较强的沟通和学习能力。
公司介绍
深圳市搜了信息技术有限公司成立于2006年,公司地址位于中国深圳南山高新技术产业区。 搜了信息技术是一家致力于搜索引擎、发布引擎等互联网商机服务领域内,集产品研发、设计、销售和服务为一体的现代化高科技企业,经过2年多高速发展,现已成长为行业内的主要力量。 搜了信息技术坚持以客户为中心,引领具有创新性、差异化商机服务产品的研发方向。自成立以来,在搜索引擎、发布引擎等领域研发差异化的创新产品. 搜了信息技术拥有一支素质优良、技术过硬的研发服务队伍,用热线、网络、上门等多样化的立位服务渠道,为客户提供及时、贴心、满意的技术支持和服务。 搜了信息技术坚信人才是公司最宝贵的资源,十分关注员工的成长和进步。公司通过多样性和及时性的绩效激励制度,鼓励价值创造,嘉奖价值创造;同时,还通过营造良好的组织氛围,建立凝聚力强的企业文化,引导大家为共同的价值观和组织目标而努力奋斗。 2008年,搜了信息技术将继续深化“为中国中小型企业提供最优质的商机服务平台”的战略方向,紧紧围绕、聚焦客户需求,成就客户事业的管理主轴,致力于为顾客、渠道伙伴、员工创造价值,成为贴近客户的企业,成为受人尊敬、成长最快的互联网品牌!