工作内容:
1.数据获取:通过抓取、API开发等技术手段完成公司业务所需的原始数据接入。
2.数据处理:负责网页信息和APP数据的抽取、清洗、去重、分类、解析等工作。
3.反爬虫应对:应对各种反爬虫措施,设计合理的爬虫策略和防屏蔽规则。
4.数据存储:参与数据存储的设计和实现。
招聘要求:
1.2026届计算机相关专业全日制大学生。
2.熟悉Python语言,了解Scrapy等爬虫框架,有网站数据采集项目经验优先。
3.了解Selenium/WebDriver等浏览器自动化技术,能够处理动态加载内容的网页。
4.掌握HTML/CSS选择器或XPath,能够准确提取网页中的结构化数据。
5.了解常见反爬虫机制及应对策略,如请求头设置、代理IP、模拟浏览器行为等。
6.具备基础的数据库操作能力,熟悉SQLite/MySQL等至少一种数据库。
7.了解基本的数据清洗、去重和格式转换方法,会使用JSON等数据格式。
8.具备良好的沟通能力和团队协作能力;能够独立完成任务,并具备较强的学习能力和问题解决能力;对新技术和新知识有持续的学习兴趣。
【工作时间】
9:00-11:30、13:30-17:30/9:30-11:30、13:30-18:00(两个时间段二选一)
【公司福利】
周末双休+法定节假日休息++餐补+加班额外餐补+出差补助+全勤奖+节日福利+员工聚餐+年度旅游
*公司定期采购零食水果,不定期下午茶,工作轻松愉悦,每天美食相伴;
*公司坐标孵化园,高新产业云集之地,公司楼下即地铁口,集环境完美与交通便利于一身;
*定期调薪机制,动力满满;
*团队年轻活跃,办公室氛围nice,快乐工作,夫复何求;
*牛师指导,助你职场升级打怪,岗位名额有限,等你来战!