【工作内容】
- 负责设计、开发和维护高效、稳定的网络爬虫系统,以获取公司所需的数据资源。
- 对现有爬虫系统进行性能优化和技术升级,提高数据采集的速度与质量。
- 分析和处理从网页中提取的数据,确保数据的准确性和完整性,并将其转化为可用于分析或业务应用的格式。
- 与团队成员紧密合作,了解业务需求,根据需求定制化爬虫策略。
- 参与技术研究,跟踪最新的网络爬虫技术和趋势,提升团队整体技术水平。
- 遵守相关法律法规,确保所有爬取活动合法合规。
【任职要求】
- 熟练掌握正则表达式、XPath及BeautifulSoup等网页解析技术。
- 了解HTTP协议,熟悉HTML/CSS/JavaScript等前端技术。
- 具备良好的问题解决能力,能够独立思考并快速定位问题根源。
- 对数据敏感,具备良好的数据分析能力和逻辑思维能力。
- 有责任心,注重细节,能够在高压环境下保持高效的工作状态。
- 英语良好者优先,能阅读英文技术文档。