职位描述:
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。
1、负责公司机器学习系统架构的设计开发,以及系统性能调优;
2、负责解决系统高并发、高可靠性、高可扩展性等技术难关;
3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等;
4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU优化技术的引入落地;
5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。
职位要求:
1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;
2、熟练掌握Linux环境下的C/C++/Go/Python/Java等1至2种以上语言;
3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分,良好的团队合作精神;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;
6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。
加分项:
1、熟悉Kubernetes架构,有丰富的云原生系统开发经验;
2、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch/MXNet);
3、熟悉Django、Flask等相关技术,有其后端开发经验;
4、有以下某一方向领域的经验:AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),Machine Learning Frameworks,ML for System,Distributed Storage;
5、有大规模云计算平台或私有云产品架构开发经验。