工作内容:
1.负责和协助研究所和计算中心计算机CPU和GPU机群的建设、管理、日常运行和维护;
2.负责和协助研究所和计算中心网页和在线服务器的建设和维护;
3.负责和协助研究所和计算中心网络的建设和通信安全运维工作(Email和VPN等);
4.参与维护HPC和AI异构平台(平台包括底层计算、存储和网络,也包括数据中台部分),包括并不限于备份,弹性扩展,迁移等操作。保障科研计算环境稳定的运行,参与开发HPC平台运行监控脚本/程序;
5.收集HPC平台客户需求,为高性能计算用户提供咨询、培训等;负责编写HPC平台应用功能详细设计和使用帮助文档。
6.负责和协助生物信息学和AI相关应用程序的开发测试和程序优化。
任职要求:
1、全日制大学本科及以上学历,计算机或生物信息相关专业;
2、具有良好的职业操守,高度的工作责任心,有比较强的执行力,组织管理能力和学习能力,工作认真细致、爱岗敬业,良好的沟通协调能力、团队合作能力和抗压抗挫能力;
3、熟悉HPC 和AI 架构;熟悉Linux、shell;熟悉HPC运维能力(至少包括PBS,SLURM,LSF中一种调度器);
4、熟悉HTML、CGI、PERL和Python等网页编写语言和技术;
5、有GPU AI 资源维护经验者优先;熟悉Tensorflow, PyTorch等AI框架者优先; 有SLURM高性能计算、科研运算经验者优先;
熟悉高性能计算机硬件、软件开发环境、工具等。熟悉或精通常用的生物信息学软件(如GATK、BWA和alphafold等)以及生物信息学分析工作流引擎(如WDL、CWL)等技术者优先。