职位信息
岗位职责:
1、负责处理和清洗大规模、多来源的数据集,保证数据的完整性和可靠性,消除数据中的偏见、冗余、毒性内容
2、提升清洗数据和生成数据的质量,通过多样算法和模型提升和优化数据质量
3、设计、构建和维护大模型相关的大数据处理系统和数据管道
4、负责数据处理中涉及到的NLP模型的设计与优化,提升数据处理的效率和准确性
5、大模型相关的数据质量把控,包括但不限于数据一致性检查、数据完整性验证等;
6、对大规模数据集进行处理和分析,确保数据的准确性和可靠性;
7、理解数据需求,与业务紧密配合,开发建立自动化数据质量评估流程及系统
8、及时发现和定位数据问题,跟踪问题的解决进度,确保数据问题得到有效解决
9、编写详实的数据评估报告,提供训练数据分析和改进建议,为团队提供有效的反馈支持;
开展数据治理,持续提升数据质量,挖掘数据价值。
任职要求:
专业:计算机、人工智能、软件工程、数学等相关专业
素质:沟通能力强,表达清晰,有责任心
经验:NLP、机器学习或大模型相关背景和经历
工作地址
北京市西城区宣武门西大街32号/西安市高新区锦业路38号
公司信息
中国移动研究院(以下简称“研究院”)成立于2001年,是中国移动“一体五环”科技创新体系中的内环核心力量,也是中国移动成立***、领域***、研发成果最丰富、高水平人才最集中的研发机构之一。
研究院科研领域覆盖无线、网络、业务、安全、人工智能、物联网、测试、战略市场产业以及前沿技术等,获批新一代移动信息通信技术国家工程研究中心、智慧网络国家新一代人工智能开放创新平台等***创新平台,累计承担国家重大科技专项等国拨项目180多项,申请国内专利超1.2万件、海外专利超1200件,提交国际标准文稿2.6万余篇,牵头5G国际标准项目210多个,担任***领导职务50多个,标准化影响力稳居全球运营商***阵营。荣获国家科技进步奖特等奖等6项***科技奖项,190余项省部级科技奖项,1项中国专利金奖,4项中国专利银奖,15项中国专利优秀奖,拥有CNAS认证实验室、网络安全等级保护测评机构等资质,助力公司实现了移动通信领域技术与业务的跨越式发展,为我国移动通信技术实现“1G空白、2G跟随、3G突破、4G并跑、5G引领”发挥了重大作用,同时全力引领5G-Advanced、6G、算力网络等信息通信领域重要方向发展。
当前,研究院正积极贯彻落实国家科技创新要求和公司创世界一流“力量大厦”战略,以“做世界一流的信息服务科技创新引擎”为愿景,以“成为国家战略科技力量主力军、企业科技创新主力军”为目标,立足“技术创新与产业引领、企业与行业高端智库、关键平台与能力研发”三大定位,全力支撑公司数智化转型和高质量发展,支撑科技强国建设和高水平科技自立自强。