【岗位职责】
1. 参与大语言模型(LLM)相关算法研究、开发,包括但不限于指令微调、强化学习等提高算法效果和效率;
2. 参与大模型的知识蒸馏、模型裁剪和模型微调等任务,提升模型的效果和性能;
3. 大模型指令微调数据挖掘、数据处理、数据增强及数据分析,筛选高质量的训练数据提供模型训练;
4. 参与大模型对齐相关工作的调研与优化,提升大模型的价值观、安全性等方面的效果;
5. 跟踪国内外最新的大语言模型相关技术和研究成果,进行算法和模型技术创新;
6. web前端设计开发。
【岗位要求】
1. 计算机相关专业,硕士及以上学历;
2. 熟练使用至少一个深度学习框架,Tensorflow、PyTorch等;
3. 熟练使用至少一种编程语言,Python、Java等;
4. 熟悉vue、JavaScript等;
5. 具有扎实的机器学习、深度学习和NLP基础。有预训练语言模型、文本生成相关经验者优先,如:机器翻译、文本摘要、文本改写等;
6. 熟练使用Linux命令,Shell脚本;
7. 具有良好的沟通能力与团队协作精神,主观能动性强,做事细心靠谱;