大模型Post-Training算法研究员/研究工程师(北京)
 北京
 1年
 本科
 全职
 招若干人
 更新于03-13
收藏
职位信息

学历要求:硕士及以上
专业要求:人工智能、计算机、电子信息、软件工程、通信工程、网络安全等相关专业
岗位职责:
1. 参与下面一个或多个研究方向
数据合成:研究合成数据方法,合成数据质量与分布对大模型训练的影响,利用合成数据训练SOTA模型。
指令遵循:提升指令遵循能力,优化复杂指令遵循效果;研究多轮场景指令遵循优先级;降低指令攻击成功率等。
长文本:提升模型长文本场景效果,例如长文本问答、RAG场景、Repo-Level代码编写、超多样本ICL等方向
特定领域RM:利用对应领域特性设计和收集相应反馈信号、研究数据、预训练、微调等对RM的影响、研究RM泛化性、研究PRM等相关问题
RLHF:研究不同强化学习算法(DPO/GRPO/PPO等)、数据分布、采样策略等对大模型效果的影响
知识注入/改写:研究在不影响原有能力情况下如何给大模型注入少量知识(例如模型身份)或大量知识(例如更新模型知识截止日期),或改写大模型已有知识
2. 参与跟踪前沿论文、数据构建、训练调优、评测迭代、论文撰写与发表等相关工作
应聘资格要求:
1.本科在读及以上学历,计算机科学与技术、人工智能、计算机、机器学习、大数据、数学等相关专业;
2.熟悉 Python,具有较强的代码开发和实现能力,至少熟练掌握Pytorch、TensorFlow等主流深度学习框架1种,能熟练使用 Linux。
3.具备良好的学术视野和开拓精神,勇于钻研新技术,能主动思考、主动作为、主动反馈;有很强的好奇心与执行力;
4.发表过大模型领域知名论文、博客或开源项目者优先
5.有大模型实习经历者优先
6.有大尺寸模型训练经验或大规模GPU集群使用经验者优先
工作地址
 北京市
应届生安全提醒
求职过程中如果遇到违规收费、信息不实、以招聘名义的培训收费或者微信营销等虚假招聘行为,请保留证据,维护自己的合法权益。谨防上当受骗!
公司信息
中电信人工智能科技(北京)有限公司(以下简称“人工智能公司”)是中国电信开展人工智能业务的科技型、能力型、平台型专业公司,以央企领先、世界一流为目标,强化科技攻关,对内对外提供高质量的人工智能产品与平台服务,积极赋能千行百业,助力数字经济发展。人工智能公司以成为领先的通用人工智能服务提供商为愿景,以发挥央企在AI领域的主力军作用,成为国家战略科技力量为使命,承担央企责任,强化科技攻关。 中国电信股份有限公司人工智能研究院(上海)(以下简称“TeleAI”)由中国电信集团CTO、首席科学家李学龙教授发起并组建。TeleAI面向国家战略需求和未来人工智能发展趋势,结合中国电信在算力、数据、应用场景及通信等多方面的优势,围绕大模型、具身智能、AIGC、AI Infra、智传网等方向开展基础研究、技术攻关和应用落地,旨在打造人工智能研发与产业转化标杆性平台,通过跨学科、跨领域的协同创新,汇聚人才和团队,形成产学研用一体化的创新生态,以人工智能新质生产力赋能千行百业,以科技创新引领现代化产业体系建设。
下载App 查看公司其他职位
公司信息更多职位
img人工智能公司&人工智能研究院
国企
通信/电信运营、增值服务
笔面经求分享~
已经收到笔试消息了吗
这个有截止日期吗
这个具体也不清楚啊 没说具体截止日期 可以去公众号看看
这个岗位看重985,211吗?
不确定呢
下载App 参与互动