主要职责:
1.设计并训练蛋白质语言模型,确保模型性能优越。
2.评估模型性能,提出优化建议并实施改进。
3.分析大规模蛋白质序列数据集,进行批量结构预测。
4.计算复合体结构,根据结构特征筛选和优化训练集。
专业背景要求:
1.在读硕士或博士,生物信息学、生物学或相关领域背景,且具备较好的编程能力。
2.或非生物学背景但具有Biology + AI研究经历,对生命科学和人工智能领域有深入了解。
3.境外学生可以远程实习。
优先考虑:
1.拥有生物与计算机科学交叉学科背景。
2.在GitHub上有活跃且可访问的开源项目记录,展示您的技术实力和团队协作能力。
3.具备出色的数据整理和代码编写习惯,能够高效管理数据和代码。
4.优秀的沟通能力和团队合作精神,能够与团队成员有效沟通并协同工作。