刷新时间:2023-11-28
python爬虫、数据仓库开发工程师 5-8K 参考工资
山东省济南市槐荫区  |  1-2年 |  本科  |  年龄不限  |  招3~5人  |  全职
...
收藏 投诉
岗位职责

1、负责公司数据源抓取需求,满足公司对多源数据采集要求;
2、实现大规模数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析入库等工作;
3、.研究优化算法,提升爬虫系统的稳定性、可扩展性 ;
4、能独立解决实际开发过程碰到的各类问题 。
任职要求:
1、本科以上学历,2年以上爬虫开发相关经验,熟练使用Python进行开发;
2、 熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;
3、 熟悉各种抓取技术,包括代理、PhantomJSselenium、验证码处理; 4、精通一种开源爬框架,如scrapy、webmagic、nutch、heritrix等;
5、熟悉各种反爬虫技术及其应对措施,有分布式爬虫架构经验优先;
6、具有良好的团队协作精神,思维清晰敏捷,逻辑分析能力强。

岗位要求

1、负责公司数据源抓取需求,满足公司对多源数据采集要求;
2、实现大规模数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析入库等工作;
3、.研究优化算法,提升爬虫系统的稳定性、可扩展性 ;
4、能独立解决实际开发过程碰到的各类问题 。
任职要求:
1、本科以上学历,2年以上爬虫开发相关经验,熟练使用Python进行开发;
2、 熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;
3、 熟悉各种抓取技术,包括代理、PhantomJSselenium、验证码处理; 4、精通一种开源爬框架,如scrapy、webmagic、nutch、heritrix等;
5、熟悉各种反爬虫技术及其应对措施,有分布式爬虫架构经验优先;
6、具有良好的团队协作精神,思维清晰敏捷,逻辑分析能力强。

工作地址
山东省济南市槐荫区·济南槐荫区济南报业大厦B座9层
HR信息
赵志
3日内活跃
人力资源部 | 校园招聘经理
与HR聊聊
安全警示
立即投诉

在求职过程中如果遇到扣押证件、收取押金、提供担保、强迫入股集资、解冻资金、诈骗传销、求职歧视、黑中介、人身攻击、恶意骚扰、恶意营销、虚假宣传或其他违法违规行为。请及时保留证据,立即向平台举报投诉,必要时可以报警、起诉,维护自己的合法权益。

公司其他职位 查看本公司更多职位
副总裁/副总经理
50K以上 济南市-槐荫区 | 年龄不限 | 本科
教育/培训 学术/科研
私营企业
1000人以上
济南市槐荫区报业大厦B座9层
感兴趣的职位
济南市槐荫区 | 1-2年 | 高中
济南中正试验机制造有限公司
济南市槐荫区 | 经验不限 | 大专
济南天齐特种平带有限公司
信用卡销售 6000元/月
济南市槐荫区 | 学历不限
泰安市泰山区道合信息咨询中心
济南市 | 经验不限 | 大专
山东钢轩信息科技有限公司
济南市 | 经验不限 | 高中
山东钢轩信息科技有限公司
风险提示
企业基本资料已通过 平台认证
以上资料仅供参考,请求职者 规避求职风险