东京工业大学(Tokyo Tech)的全球科学信息与计算中心(Global Scientific Information and Computing Center,GSIC)于4月1日启动了其下一代超级计算机“TSUBAME 4.0”的运营。
自2006年4月TSUBAME1.0开始运营以来,东京工业大学的TSUBAME系列超级计算机作为“全民超级计算机”,长期以来一直支持日本及海外的工业、学术界和政府的研究与开发工作。最新的系统TSUBAME4.0现已在铃木台校区投入使用,并广泛利用其图形处理单元(GPUs)[1]这一TSUBAME系列的特色,在保持与TSUBAME3.0系统连续性的同时,性能和易用性提高了5.5至20倍。
此外,TSUBAME系列首次邀请公众提交机架设计。该设计灵感来自新超级计算机的各种可能性和应用,描绘了四只燕子在无垠的世界中展翅翱翔,自由绘制流动线条的景象。
TSUBAME系列的使用不仅对东京工业大学的研究人员开放,还通过联合使用计划,如跨学科大规模信息基础设施联合使用研究中心(JHPCN)和创新型高性能计算基础设施(HPCI),向校外和企业研究人员开放。目的是继续将其打造为“更贴近全民的超级计算机”,并使其能够日常使用。
TSUBAME4.0在64位双精度[2](主要用于科学技术计算)方面表现出色,同时在16位半精度[4](用于AI)方面达到了952拍浮点[3]的性能,相当于日本研究和教育机构中仅次于“富岳”(Fugaku)的第二大超级计算机。
表1. TSUBAME4.0配置
计算节点/单元数量 | HPE Cray XD665,240单元 |
---|---|
以下是每个单元 | |
处理器 | AMD EPYC 9654(96核)×2单元 |
主内存 | DDR5-4800 768 GiB |
GPU | NVIDIA H100 SXM5 94GB HBM2e×4单元 |
高速网络 | InfiniBand NDR200 200 Gb×4单元 |
本地存储 | 1.92 TB NVMe SSD |
共享存储 | HPE Cray ClusterStor E1000 |
表2. TSUBAME4.0系统性能
总计算能力 | |
---|---|
双精度 | 66.8拍浮点(是TSUBAME 3.0的5.5倍) |
半精度 | 952拍浮点(比TSUBAME 3.0高20倍) |
共享存储容量 | 硬盘部分44.2 PB(是TSUBAME 3.0的2.8倍) |
为纪念运营开始,GSIC于4月18日在铃木台校区举行了TSUBAME4.0揭幕仪式和参观活动,约有100名嘉宾参加。
揭幕仪式由GSIC主任伊藤敏哉致开幕词,随后由嘉宾发表祝贺词。GSIC教授远藤敏雄概述了TSUBAME4.0后,计算机科学学院计算机科学与工程系教授秋山由贵发表了题为“超级计算机加速中分子药物发现趋势”的学术讲座,GSIC教授横田里奥则发表了题为“东京工业大学和AIST(日本产业技术综合研究所)