岗位详情:
①负责 AI 算力集群的部署与运维,包括 GPU/TPU 服务器的安装、配置、调试,以及集群节点的日常状态监控、故障排查和修复,确保算力集群稳定运行。
②参与 AI 算力相关新技术的调研与实践,如新型 AI 芯片的部署测试、异构计算的应用验证等,为算力中心的技术升级提供支持。
能力要求:
①熟悉主流 AI 芯片装维、硬件特性及故障处理;
②掌握 Linux 操作系统,熟悉 Shell、Python 等脚本语言;
③了解分布式计算框架、深度学习框架的基本原理;
④有编写AI系统集成和云服务方案经验者优先。






湄浦路361弄互联宝地锦溥园2号楼





