岗位职责:
1.负责大模型的推理效率提升,保障模型效果、稳定性与落地性能;
2.主导大模型在 RAG 和 Agent 领域的能力构建;
3.推动大模型在具体业务场景的适配,完成 Prompt 工程、工具调用、多轮对话规划等功能开发,结合 思维链COT 技术提升通用问题解决能力;
4.与产品、工程团队协作,实现 AI 功能 的产品化落地,根据用户反馈快速迭代模型;
5.跟踪大模型领域(如 多模态、长上下文、逻辑推理)的前沿研究,探索新应用方向,将创新技术融入产品;
6.负责大模型应用开发范式及一站式研发平台的设计、开发及应用,支持公司内部大模型应用的快速落地;
7.支持大模型在公司应用中的落地研发和效果优化;
8.保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性。
任职要求:
1.计算机科学、人工智能等相关专业
2.至少 1年 以上 大模型研发 经验,精通主流模型(如 GPT、LLaMA、Qwen、DeepSeel 等)的原理;
3.熟悉 RAG 架构、Agent 开发,掌握检索/排序/意图识别等技术,熟练使用 LangChain、LlamaIndex 等工具;
4.精通 Python 及深度学习框架(PyTorch),具备高性能代码实现与问题调试能力;
5.熟悉 SGlang、Vllm推理框架 的部署及调优;
6.熟悉 大模型在数据分析中的应用;
7.熟悉 文档解析技术,熟悉 向量化技术 及 Milvus 的分布式部署;
8.良好的跨团队协作与沟通能力,能高效推动技术落地;
9.对 AI 技术有热情,具备独立研究与创新能力;
10.至少主导或深度参与1个以上 AI 应用项目,具有实际落地场景经验者优先;
11.有使用过 DeepSeek/OpenAI/Claude 进行辅助开发的经验者优先;
熟练使用 IntelliJ IDEA、Git 等开发工具。
技术栈:
●编程语言:Python
●深度学习框架:PyTorch, TensorFlow
●模型应用:GPT, LLaMA, Qwen, DeepSeel
●工具与框架:LangChain, LlamaIndex, SGlang, Vllm
●向量化技术:Milvus
●数据库与存储:MySQL, Redis, MongoDB
●容器化:Docker, Docker Compose
●版本控制:Git