您当前的位置:首页 > 后端开发 > Python开发工程师

[北京-海淀区]python爬虫高级开发工程师工作职责

时间:2020-09-18 ...

岗位职责:

1、 设计和开发汽车垂直网站已知账号密码下的账户爬取系统,负责爬虫核心算法和调度策略优化;

2、 负责网络网页自动图形、文字验证码的自动登录,信息精准抽取等搜索核心技术,构建高可用性、高可扩展性的网络信息搜集软件;

3、熟悉爬虫的应用策略和网站的防爬机制,解决各类验证码识别机制,提升网页抓取的效率和质量;

4、负责多个汽车垂直业务网站和APP数据的数据爬取、解析、过滤,清洗、消重、结构化处理等工作,提升平台的抓取效率。

5、软件的日常维护

任职要求:

1.       大学本科及以上学历,计算机相关专业,基础扎实;开发过类似软件

2.       Python工作经验2年以上,熟悉Python常用函数库,熟练掌握Xpath和正则表达式;

3.       精通常用Python爬虫框架中的一种或多种,熟悉Scrapy、Pyspider框架中的至少一种;

4.       熟练掌握Linux系统;

5.       熟练掌握MySql、Redis、MongoDB等,有丰富的mysql性能优化经验;

6.       熟练掌握网页抓取原理及解析技术,对SQL优化有一定的经验熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;

7.       具有优秀的团队合作和沟通协作能力,善于学习,能承受较大的工作压力。

参考工资:1-3万/月


版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,如有本文知识产权人并不愿意我们使用,请联系我们:304541079@qq.com,我们会立即删除。

相关职责

    无相关信息

职责吧

陕ICP备14001139号-1

浏览