工作职责
1、主导多模态算法和模型的研究与开发,包括但不局限于文本/图像、文本/视频、文本/音频等跨模态算法研发和优化,输出行业领先的技术解决方案;
2、推进多模态内容理解与生成的技术,通过整合不同模态的数据(如文本、图像、声音、视频等),实现跨模态的信息提取和融合,使模型能够更全面地理解复杂场景或任务,从而提升推理和决策的准确性。
3、探索多模态/NLP/CV等方向的AI前沿技术,承担***/省部级科研课题,输出高价值成果;
工作要求
【能力素质】
1、诚实、正直、有责任心,认同企业文化;
2、熟悉Python/C/C++开发,熟悉Linux开发环境,能够运用OpenCV实现常用的图像处理算法;
3、基于GPU平台,熟悉Tensorflow、mxnet、PyTorch等至少一种深度学习框架;
4、熟悉CV&ML领域的基础理论,熟悉某一方向如图像分类、人脸识别、目标检测的算法体系;
5、能承担较大工作压力,有较强独立分析、解决问题的能力。
6、有Qwen2-VL-7B、DeepSeek-VL2-tiny、CLIP、janus pro 7B使用经验值优先。
【专业学历要求】
1、本科及以上学历在校生,2026届毕业生优先;
2、计算机类、电子信息类、数学类等相关专业优先。