学历要求:硕士及以上
专业要求:人工智能、计算机、电子信息、软件工程、通信工程、网络安全等相关专业
岗位职责:
1. 负责大模型轻量化技术的研究与开发, 包括但不限于模型剪枝、量化、低秩分解、以及显存优化、提示词压缩等;
2. 跟踪最新的技术进展,参与研究成果总结与输出,包括发表高水平论文、参与标准制定、申请发明专利等;
3. 支持多模态大模型在边缘场景的落地工作;
应聘资格要求:
1. 人工智能、计算机、电子信息等相关专业硕士及以上学历;
2. 具有扎实的研究基础,掌握深度学习算法基本原理,熟悉神经网络基本架构,了解主流LLM 、MLLM模型,具有相关的研发经历;
3. 具有工程实现能力,熟练掌握Python、C++等至少一种编程语言,熟练使用至少一种深度学习框架(Pytorch、Tensorflow);
4. 具有出色的沟通能力和团队领导力、能带领实习生完成算法研究和技术落地工作;
加分项:
具有博士学位者优先;
在国际***会议或期刊上发表过论文者优先;
有 vLLM 、TensorRT、MLC-LLM 等推理引擎开发经验者优先;有CUDA开发经验者优先;