1、牵头智算资源池及平台的运营管理、规划支撑和平台验收等工作;
2、牵头智算设备性能、算能算效调优,RDMA网络性能优化、故障快速定位高效解决;
3、引领公司智算方向的新技术、新业务的跟踪和研究,以及负责智算业务的应用和新业务的拓展支撑;
4、负责客户项目售前和售中技术支撑、售后维护服务等工作,支撑客户模型迁移和训练调优等工作。
任职资格:
1. 精通RDMA网络技术,具有丰富的RDMA网络配置和维护经验;
2. 精通GPU硬件架构和工作原理,具备较强的GPU硬件设备维护和故障分析处置能力;
3、具备较强的智算资源池的规划设计和搭建能力,精通ARM的体系结构、Linux操作系统;
4、熟悉深度学习理论,了解常用的深度学习开发框架;
5、具备大规划智能算力池维护经验者优先,具备模型迁移和训练调优经验者优先。
