【岗位职责】:
1.模型开发与优化:参与大模型的研发、部署及性能调优,包括算法工程化实现、推理效率提升及模型服务化接口开发。
2.系统架构与维护:协助构建和优化模型评测体系,完成基准测试,保障模型在生产环境中的稳定性与高效运行。
3.技术落地与创新:结合业务场景,探索大模型在垂直领域的应用(如 NLP、CV、智能驾驶等),推动技术方案落地。
4.数据处理与分析:主导数据采集、清洗及标注,优化数据质量以支撑模型训练需求。
5.技术协作与调研:跟踪大模型前沿技术动态,参与团队技术交流与项目协作,完成技术文档撰写。
【岗位要求】
1.精通 Python 编程语言,熟悉 Linux 操作系统及 Docker 容器技术;
2.掌握机器学习 / 深度学习基础,熟悉主流框架(如 PyTorch、TensorFlow)及大模型架构(如 Transformer、LLM);
3.了解模型推理优化方法(如 TensorRT、vLLM)及分布式训练技术者优先。
【工程素养】:
1.具备良好的代码规范意识,熟悉 Git、CI/CD 流程;
2.有算法工程化经验,能独立完成模块开发、测试与联调。
【实践经验】:
1.参与过 NLP、CV 或大模型相关项目,有模型微调、Prompt 工程或 RAG 架构经验者优先;
2.熟悉 LangChain、LlamaIndex 等工具链,或有算法竞赛、开源项目经历者加分。