职位描述:
1.负责大语言模型的设计、开发和优化。
2.研究和实现最新的自然语言处理(NLP)算法和技术,提升模型的性能和效率。
3.参与跨模态语义对齐、可控生成、模型量化等领域的研究和开发工作。
4.与团队成员协作,进行算法的实现和应用,推动研究成果在实际产品中的落地。
5.负责撰写技术文档、研究报告及专利申请材料。
6.跟踪国内外***进展,进行技术预研和创新,推动团队在前沿技术领域的竞争力。
任职要求:
1.计算机、电子信息、数学等相关专业硕士及以上学历。
2.熟练掌握自然语言处理、计算机视觉等领域的基本理论和算法。
3.至少掌握一种深度学习框架(如TensorFlow、PyTorch等),具备实际项目经验。
4.熟悉大模型的训练和优化方法,有大规模分布式训练经验者优先。
5.熟练掌握Python、C++等编程语言,具备良好的编码能力和工程实践经验。
6.具备较强的分析和解决问题的能力,能够独立开展研究工作。
7.良好的沟通和团队协作能力,能与不同领域的专家进行有效合作。
8.具有相关领域的学术论文发表经验或发明专利者优先。
9.对前沿技术有浓厚兴趣,具备快速学习和接受新技术的能力。