岗位职责
负责AI大模型的评测与分析工作,与模型训练团队配合不断优化提升AI大模型效果。具体工作内容包括但不限于:
1. 深入理解大规模预训练语言模型,参与模型评测方案的制定与评测数据集的建设。
2. 通过对模型进行全方面细致的评测,明确模型能力边界,对模型能力进行深入分析,产出围绕大模型的客观认知,从而为模型训练迭代提供指导意见。
3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。
4. 与各相关部门保持良好沟通,深度参与大模型训练及应用,为各大模型相关方提供评测及相关的模型分析支持,共同推动大模型的训练与应用。
5. 良好的项目管理能力,有一定的抗压能力和优良的意志品质。
任职资格:
1. 研究生及以上学历,计算机、数学、统计学或相关专业;
2. 了解Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力
3. 对机器学习或深度学习算法的基础知识,自然语言处理或大模型相关算法和模型感兴趣;
4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。
5. 紧跟人工智能行业进展,对前沿技术和行业趋势有比较高的敏感度
7. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能;
8. 有生成式大模型(如stable diffusion)研究经验;
9.英语达到4级以上优先
10.有项目经验的优先。