【岗位职责】
1. DeepSeek本地部署大模型,及优化;
1)参与LLM(DeepSeek等)的预训练及参数微调全流程开发;
2)设计模型调优策略,实现模型在垂直场景的性能优化;
3)构建自动化微调工具链,提升模型迭代效率;
2. 数据处理体系搭建;
1)负责多源异构语料清洗(去噪/去重/标准化);
2)开发智能标注工具,构建高质量训练数据集;
3)设计语料质量评估体系,持续优化数据管道;
【任职要求】
硬性条件
1、计算机/数学/统计相关专业统招本科及以上
2、熟练掌握Python编程,具备PyTorch/TensorFlow实战经验
3、深入理解Transformer架构及Fine-tuning技术原理优先
4、有HuggingFace/DeepSpeed等框架使用经验者优先
加分项
1、参与过NLP竞赛/Kaggle项目并取得Top排名
2、在ACL/EMNLP等会议发表过论文
3、有开源项目贡献经历
4、熟悉Prompt Engineering技术体系
其他:
工作时间:9:00-6:00,周末双休
免费午餐和班车
不提供住宿,公司有公租房需自费
接受26届在校生,表现优异可申请转正