1秒钟千万亿次计算构筑“最强大脑”
走进国家超级计算济南中心(下称“济南超算”)的机房区域,“山河”超级计算平台正在高速运转。一排排一人多高的主机整齐排列,相互链接,指示灯规律闪烁,机身上蓝色的“山河”二字格外引人注意。
作为全国最大的异构超级计算集群,“山河”超级计算平台高性能计算能力达60PFlops(1PFlops代表一秒钟执行一千万亿次浮点运算),人工智能计算能力达1000Pops(1Pops代表一秒钟一千万亿次智能计算),存储容量245PB,综合算力处于国际前列。
一秒钟进行一千万亿次智能计算的“大脑”究竟有多强?在此算力支撑下,虚拟数字人通过接入大模型完成智能问答,仅需百余小时即可完成训练;空气质量预报精度可达2公里范围,相当于具体到每一个小区……
2023年5月,在德国汉堡举办的ISC2023世界高性能计算大会上,济南超算构建的验证性计算集群以超越历史最佳纪录15倍的绝对优势,登顶全球IO500榜单。
从受制于人到世界领先,我国超级计算机在一次次升级改造过程中占地面积越来越小,能耗与成本逐渐降低,整体性能与计算能力却日益提高。
2011年,济南超算建成我国首台完全采用国产处理器和系统软件构建的千万亿次超级计算机“神威蓝光”。2022年,新一代神威超级计算机——“神威蓝光Ⅱ”问世,从核心器件到系统软件全部实现自主研发,实现了超算领域核心技术的完全自主可控。相比于“神威蓝光”,“神威蓝光Ⅱ”占地面积缩减至原来的三分之一,计算能力却提升14倍。
“中国超算与世界超算的发展格局是一致的,而这比摩尔定律还要超前。”济南超算副主任、济南超算研究院院长潘景山说。摩尔定律由英特尔创始人之一戈登·摩尔提出,根据该定律,大约每隔一年半,芯片的性能会提高一倍。对于超级计算机,则是每10年性能可以提升1000倍。
“最强大脑”还要有“最强应用”。通过开展跨学科、跨单位的广泛交叉合作,基于济南超算的应用成果频出。
济南超算的国家生态环境监测大数据超算云中心大屏幕上,数字跃动,这里实时显示着全国5000多个站点的空气质量情况。借助“山河”超级计算平台的算力,空气质量预报精度从5公里提高至2公里范围。“精度5公里相当于预报的范围精确到一个小区,而2公里意味着精确到一个场馆。”潘景山说,去年的杭州亚运会上,空气质量预报范围就精确到每个运动场馆,实现了“小时级”“公里级”突破。
“在济南超算的强大算力支持下,天气预报与气候预测、海洋环境模拟分析、信息安全、工业仿真、工程计算、金融大数据分析、智慧城市等领域的3000多家科研院所、高等院校、高新技术企业、政府单位都搭上了‘算力快车’。”山东省计算中心(国家超级计算济南中心)主任吴晓明说。
比如,高铁建造成何种外形可以抵抗突如其来的横风?两条并行的铁轨间距究竟多大,既可以避免两辆高铁会车时发生碰撞,又不会太远导致土地浪费……如果通过真正的实验解决这些问题,需要付出高昂的成本,但通过超算建立仿真模型进行计算测试,这些问题可低成本、更高效解决。
超算赋能千行百业,但算力再强,若无法联结成网,便只是一座孤岛。2022年7月,济南超算正式启动国内首个超算互联网工程,推动建设覆盖全省16地市的“山东算网”;2024年5月,“山东算网平台”正式上线,强力推动国家算力网络建设。
经过持续科研攻关与探索,目前济南超算在山东算网建设领域实现多项技术突破,在高速网络通信、资源感知调度、算力网络融合和安全方面攻克一批核心“卡脖子”技术难题。潘景山说,下一步,济南超算还将在超算互联网涉及的软硬件上进一步探索和优化,力争实现“国产车道跑国产车”。
随着超算网络的延伸,“像建设电网一样建设算网、像运营互联网一样运营算网、让用户像用水电一样使用算力”的愿景正在逐步变成现实。