工作职责:
AI产品研发+项目实施交付
1、负责公司AI产品(大模型开发平台等)的后端代码开发及运维,持续对平台进行改造和优化。
2、参与公司AI产品(大模型开发平台等)实施交付、二次开发工作。
任职要求:
1. 全日制硕士及以上学历,理科相关专业,应届毕业生;
2. 以下能力至少包含一种:
- 熟悉大模型训练框架的使用,包括DeepSpeed、Llama-factory、ms-swift等任意一种,熟悉SFT/RLHF/DPO/PT等模型训练方式。了解大模型分布式训练或RAY等分布式框架的使用。
- 掌握多种大模型推理加速技术,了解vLLM/SGLang等加速框架的功能特性,可以基于框架进行推理部分特性的改进工作。
- 掌握多模态大模型训练和推理框架技术,有多模态大模型相关的训练、推理、推理应用经验。包括图像视频理解、语音理解、图像生成等多模态大模型。
3. 熟悉Python编程,有较强代码功底,了解面向对象思想及开发模式;
4. 熟悉Linux常用命令及基本操作, 了解Docker、K8S、Git;
5. 具备较好的学习能力、问题分析能力,可以独立定位解决问题;
6. 善于思考,能自主提出改善产品方案。