学历要求:硕士及以上
专业要求:人工智能、计算机、电子信息、软件工程、通信工程、网络安全等相关专业
岗位职责:
1. 参与下面一个或多个研究方向
数据合成:研究合成数据方法,合成数据质量与分布对大模型训练的影响,利用合成数据训练SOTA模型。
指令遵循:提升指令遵循能力,优化复杂指令遵循效果;研究多轮场景指令遵循优先级;降低指令攻击成功率等。
长文本:提升模型长文本场景效果,例如长文本问答、RAG场景、Repo-Level代码编写、超多样本ICL等方向
特定领域RM:利用对应领域特性设计和收集相应反馈信号、研究数据、预训练、微调等对RM的影响、研究RM泛化性、研究PRM等相关问题
RLHF:研究不同强化学习算法(DPO/GRPO/PPO等)、数据分布、采样策略等对大模型效果的影响
知识注入/改写:研究在不影响原有能力情况下如何给大模型注入少量知识(例如模型身份)或大量知识(例如更新模型知识截止日期),或改写大模型已有知识
2. 参与跟踪前沿论文、数据构建、训练调优、评测迭代、论文撰写与发表等相关工作
应聘资格要求:
1.本科在读及以上学历,计算机科学与技术、人工智能、计算机、机器学习、大数据、数学等相关专业;
2.熟悉 Python,具有较强的代码开发和实现能力,至少熟练掌握Pytorch、TensorFlow等主流深度学习框架1种,能熟练使用 Linux。
3.具备良好的学术视野和开拓精神,勇于钻研新技术,能主动思考、主动作为、主动反馈;有很强的好奇心与执行力;
4.发表过大模型领域知名论文、博客或开源项目者优先
5.有大模型实习经历者优先
6.有大尺寸模型训练经验或大规模GPU集群使用经验者优先