工作地点
河南省,郑州市,高新区,电厂路与泾河路交叉口国家大学科技园15栋E座
岗位职责
职责描述:
1. 负责数据爬虫程序设计,开发及维护,对目标网站进行数据爬取分析,找到最优化的爬取策略。
2. 维护代码质量,定时编写代码文档,解决封账号、封IP等技术难点。
3. 针对不同网站,编写及维护网页爬取配置;对爬取的内容进行提取、处理、优化、过滤、审核、入库等操作:
关于爬虫工作:
由于网站较多而且变化很快,因此可能需要经常更改程序或开发新的数据抓取程序,而搜索引擎方面搜索量非常大,也需要持续不断地进行程序的开发和修复,项目的前景广阔。而且熟悉PYTHON后还能开发类似数据处理和分析、语意分析等高层次的技术开发,不只局限于用来开发网页爬虫。
任职资格
任职要求:
1. 具备Python开发经验,熟悉Selenium/Phantomjs/Beatuifulsoup/Scrapy等工具或框架优先;
2. 对HTML、CSS、JS等前端技术有一定了解,熟悉正则表达式优先;
3. 熟悉Mssql,Mysql等主流数据库优先;
4. 热爱技术工作,乐于沟通, 具有团队合作精神,工作热情、创造力和高度责任感
工作时间早上8:00—18:00
中午休息时间11:30—13:30(午休2个小时)
联系电话:17398966068