智联提示您:用人单位以任何名义向应聘者收取费用都属违法行为(如押金、资料费、代收体检费、代收淘宝信誉等),请提高警惕并注意保护个人信息!
  • 职位描述
  • 公司介绍

举报收藏

工作职责:

1.   负责制定网络数据抓取规则,数据的提取、清洗、入库以及汇总的开发工作。

2.   负责传统网页、电商网站、社会化媒体网站等互联网数据的高效采集与正确解析。

3.   负责搜索爬虫的核心技术研究与开发,搜索前沿爬虫技术并实践。

4.   大规模分布式互联网爬虫系统的开发和维护,提升网页抓取效率和质量。


任职要求:

1.       专科或以上学历,计算机及相关专业,2年以上Python开发经验。

2.       熟悉搜索引擎和网络爬虫相关技术,有网页采集开发经验优先。

3.       熟悉scrapy框架以及xpath选择器优先。

4.       数据敏感度及钻研精神。

5.   有强烈的求知欲,关注行业内不断涌现的新技术,能够积极主动沟通,有很强的团队合作能力。


工作地址:

上海市杨浦区大连路500号西门子大厦D座Wework 107 查看职位地图

  • 职位推荐
  • 今日相似推荐

信励(上海)信息科技有限公司

信励(上海)信息科技有限公司