岗位职责:1.负责大模型、深度学习理论、算法相关的研究工作;
2.探索大规模预训练模型(不限文本、音频、图像)的算法研发和模型训练等相关工作;
3.探索前沿大模型训练相关技术的发展,包括但不限于算子优化, 计算划分与调度、动态重计算、流水线优化等;
4.研究业界最前沿的NLP、视觉、多模态等大模型及相关工程化工作,解决大模型业务落地的事实可靠性、服务性能等相关技术障碍,形成大模型推理/微调服务、AI应用工具链等平台化能力;
5.负责推动项目中大模型的各种落地应用实施。
任职要求:1. 硕士及以上学历,人工智能、计算机科学与技术等相关专业 ,具有较强的机器学习、深度学习相关技能和算法模型、数据挖掘等相关方向的研究经验。
2.具有浓厚的前沿新科技探索兴趣,具备较强的独立分析、解决问题的能力,能独立完成科研工作,在国内外重要学术刊物或重要国际会议(如TPAMI,KDD,NeurIPS,ICML,ICLR,CVPR等)发表过高水平学术论文者优先;
3、具有扎实的数理基础,对大模型与深度学习的基本原理有透彻的理解;
4.熟悉大规模预训练模型,有LLM或GPT相关项目(算法或工程均可)落地经验者优先。