软件学院数据基座与科研创新平台需求调研报告

在获批首批国家特色化示范性软件学院的背景下,软件学院积极申报大型科研仪器计划,2023年度通过学校重大设备购置和配套设施建设专项和学院平台建设保障经费,预计可以采购配置GPU计算加速卡的(超融合)机架式服务器19台,配置GPU计算加速卡76个,算力总和约2.8PFLOPS,存储空间约3PB。

经过前期初步论证,学院决定基于新一代ICT技术,利用上述资源,建设面向专业化软件人才培养和学科发展的“特色化示范性软件学院数据基座与科研创新平台”(以下简称“平台”)。

2023年5月17日和18日,软件学院组织了围绕“软件学院数据基座与科研创新平台”建设方案的需求调研交流会。实验教学管理中心分别与软件学院人机交互与虚拟现实研究中心、软件与数据工程研究中心、网络与信息安全研究中心、人工智能研究中心、智能媒体研究中心、高性能计算与系统结构研究中心、前沿交叉研究中心的教师代表进行了面对面会谈沟通。实验教学管理中心参与调研的老师为:刘运臣、郭伟、王政、盛男、陈洪波、万林。

参会老师在听取了关于平台的建设构想介绍后,围绕有关需求问题进行了充分的交流讨论,并提出了很多务实的需求和建议。现将调研结论归纳如下:

1.关于平台建设模式。由于采用相同的设备规格和技术方案,并且资源应用方式也高度近似,因此平台应当与校级平台统一规划设计统一管理。此外校级平台具有更大的资源配置规格,并具备更灵活的资源调配,因此更便于学院用户获得更大算力和数据存储资源,保障未来的科研创新发展。

2.关于平台资源共享模式。由于各中心教师的算力规模和占用需求不一而足,因此用户根据各自需求按照配额申请资源,平台通过先进先出队列模式排序调度资源申请的分散共享模式更能够体现公平性,也便于充分发挥设备共享利用。

3.关于自购设备的共享。各中心愿意按照统一的技术规范和管理分配实现自购设备并入平台。

此外,各中心还提出了以下具有代表性的建议:

1.平台的算力主要由GPU设备组成,因此GPU设备的规格应当考虑既保证一定的设备数量,也要重点布局顶级规格的设备产品,特别是个人或团队无力承担的GPU设备,例如NVIDIA A800或H800。

2.平台定位应当是定位为中小规模的开发和技术验证,因此应当能够面向个人用户开放自建计算集群的功能,并能够灵活配置集群的规格,从而使个人用户能够掌握更多样化的资源应用模式。真正海量规模算力需求应当在国家级的算力中心得到满足。

3.平台能够以中心为单位对用户进行分组,用户与用户组具有各种资源的配额机制,并通过计费功能优化资源共享模式,加速资源流转,约束不良使用行为,提高利用率。

4.平台能够支撑通过作业调度系统提交计算作业的共享集群,和以操作系统界面交互执行计算任务的独立计算实例。

5.平台能够为用户提供独立的存储空间,并能够扩展公共数据库或数据服务,支持多样化的数据访问方式。

6.期望平台在推动自购设备的资源共享方面建立有效的激励机制,例如算力银行,形成院内资源互补互帮互助的良好局面。

7.能力允许的情况下期望平台中能够集成基于国产自主可控神经网络处理器,并具有良好软件生态和发展前景的计算设备,例如昇腾处理器。

调研中,各研究中心老师普遍热切期盼平台建设能够尽快完成,尽早发挥对学科发展的关键作用,促进学院各项事业的进步。为此,下一步学院将加快论证建设管理方案。




(发布时间: 2023-05-20 | 被阅览 次 | 来源:    作者:)