岗位描述:
1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界***梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。
任职要求:
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验;
3、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展。
加分项:
1、在ACM/ICPC、Top Coder、Kaggle等比赛中取得过良好成绩是加分项;
2、在大模型领域,发表过相关论文是加分项;
3、多模态大模型的项目经历和实习经历是加分项。