搜索脉冲星、预测病毒基因演化:这届超算大赛的大学生将超级计算机性能用到极致
搜索脉冲星,预测病毒演化。
5月12日,ASC世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)经过了5天激烈的角逐,在南方科技大学落下帷幕。这项发轫于2012年的世界最大规模的大学生超算赛事,从中国到亚洲,再到世界级规模,旨在推动各国及地区间超算青年人才培养,引导大学生们运用超算挑战前沿科学,让学生可以实际动手操作全球最快的超级计算机并挑战尖端科学应用问题,提升超算应用水平和研发能力,促进科技与产业创新。
在现场竞赛中,暨南大学、清华大学分别获得冠亚军,e Prize计算挑战奖和最高计算性能奖分别由清华大学和中山大学获得。总决赛还设立了e Prize计算挑战奖、最高计算性能奖、应用创新奖、超级团队赛奖、最佳人气奖等奖项,奖金总额超38万元人民币。
参赛者搜索脉冲星
值得关注的,除了赛事结果外,还有本届大赛设立的引人注目的极具尖端科技水准和社会现实意义的考题,包括:基于“中国天眼”射电望远镜FAST真实观测数据搜索脉冲星,训练人工智能模型参加英语阅读理解考试,用经典计算机模拟量子计算,跨队伍合作挑战新冠病毒演化预测等。充分发掘学生科研潜力和探索未知的兴趣,激发其投身科研的信心。
脉冲星搜索具备很高的研究价值。近日,“中国天眼”500米口径球面射电望远镜FAST正式对全球开放。FAST是世界最大、最灵敏的单口径射电望远镜,其开放将促进中国与全球科学界合作,为全人类探索和认识宇宙做出贡献。在ASC20-21总决赛,参赛队伍挑战了一道高难度应用赛题——脉冲星搜索,他们将从FAST真实观测数据中,利用开源软件套件PRESTO搜寻脉冲星的信号数据,并尽可能缩短分析时间。脉冲星的相关研究可以解决许多重大物理问题,例如引力波探测、航天器导航等等。通过这道赛题,参赛队伍深入了解并实际利用超算平台搜索脉冲星,有助于激发大学生对天文研究的兴趣,激励他们发挥聪明才智和创新精神,探索宇宙奥秘。
(线下比赛精彩回顾。资料图由主办方提供)
此次获得了最高计算性能奖的中山大学的队员告诉记者,此次比赛充分调动了他们解决问题的能力。“为了能跑出很高的性能,充分压榨机器算力,我们需要自己去了解算法在机器上是怎么运行的,从资源调度的各方面去理解它。在这个基础上,我们还在机器上部署了自己的监控软件,实现我们所谓的‘开车’,功耗低了我们就给一脚油门,功耗高了就踩一脚刹车。队员们通过紧密合作,最大化地利用和压榨超级计算机的计算性能。我们相信各个队伍都有自己的控制技术和智慧。”对于未来高性能计算的发展前景,这位同学提出了自己的期待——“专用硬件的专用化”,他留意到了目前已经有了把密集的计算放在专用显卡上的技术趋势,包括国内也有芯片厂商有这样的探索,他对此十分期待。
利用超级计算机模拟量子计算
同时,量子计算模拟赛题也充分开发了队员们的智力。目前,量子计算还处于初级探索和投入阶段,还未像超级计算一样进入应用阶段。一位量子计算专业人士告诉记者,像“天眼”FAST的观测数据,一晚上产生的数据量可能是以T为单位的。如此大的数据量普通的个人电脑是处理分析不了的。因此,当数据量非常大的时候,就需要用到超级计算机,开发多进程的并行计算算法,来对数据进行分析。
记者了解到,目前量子计算机还未出现,想要研究量子算法,就要借助超级计算机模拟出一个特殊环境,尝试运行量子算法。参赛队员们要挑战量子计算模拟,在经典超级计算机上使用QuEST软件,模拟多种不同的量子算法来解决实际的应用问题。量子模拟可为人类在真正的量子计算机出现之前研究量子算法提供一个可靠的平台,对于研究新的算法和体系结构至关重要。“这就好像在汽车出现之前,在两辆摩托车上架一个沙发来模拟汽车。在航母造出来之前,借用十几条船链接起来,去研究上层的东西。”这对于训练如何提高算法运行效率,缩短时间十分有意义。
训练人工智能模型理解人类语言
在AI语言模型赛题中,参赛队伍需要在现场训练AI模型并让其基于组委会统一提供的英语阅读理解考试数据集,自行训练能够理解人类语言的人工智能模型,并取得尽可能高的“考试分数”。此次使用的数据集涵盖了多层次的英语语言考试,这道赛题使用面向人的任务来评估神经网络的性能,非常具备挑战性。决赛现场公布BERT格式的预训练模型尺寸和英语阅读理解考试数据集,参赛队需要基于该预训练模型和数据集现场进行模型“精调”训练,在尽可能短的时间内取得更高的“分数”。
BERT是当前最热门、应用最广泛的自然语言处理(NLP)模型之一,其参数量可高达几亿。让模型理解语言是AI研究和应用中最具挑战性的任务之一,这道赛题要求参赛队在紧张的比赛环境中训练超大NLP模型,难度非常大。
解决重大社会命题
总决赛期间,28支参赛队伍还通过抽签分组形式完成超级团队赛,通过跨团队、跨地域合作,共同挑战新冠病毒演化预测赛题VENAS。ASC20-21的超级团队赛题围绕新冠病毒展开:如何从大量的病毒基因组数据计算和监测病毒基因组的演化趋势。团队赛正是以疫情爆发以来累积的病毒基因组数据计算病毒变异演化网络,用以帮助预测病毒的演化和传播趋势。所用到的VENAS是一种改进的病毒基因组分子变异演化图谱分析系统,在保证计算准确性的前提下,可进行多进程的并行计算,能够在数十分钟内完成万数量级基因组的变异演化网络计算,从而能够接近实时的监测病毒基因组演化趋势。参赛队员使用VENAS系统,尽可能用最短的时间来完成万数量级基因组的变异演化网络计算。
(线上比赛精彩回顾。资料图由主办方提供)
为大湾区引进国际计算机人才提供平台
除了精彩赛事,本次大赛还为人才的交流和流动提供了更广阔的平台。
21记者从赛后记者会上了解到,包括南方科技大学在内的许多参赛院校与计算领域的领先企业建立了长期联合项目。南方科技大学科学与工程计算中心主任工程师范靖告诉记者,南科大与国内某著名通信企业创立了合作项目,上一届大赛的参赛学生赛后进入了企业实验室实习。从人才培养的角度看,学生们将在比赛中把能力锻炼起来了,把学习到的知识应用到了企业实践中,接着又将企业中的收获通过南科大的超算俱乐部,反馈给了下一届的参赛者,形成了有益的循环。
从人才引进的角度看,广东省内,大湾区内有很多计算机行业企业和研究机构,例如国家超级计算广州中心、国家超级计算深圳中心,学生们把自己的智慧和经验留在了大湾区内,反馈给湾区企业,也从侧面助力了粤港澳大湾区的高层次人才引进和产业发展。
打造全球最具挑战性的超算竞赛
在历届大赛中,ASC一直都将世界顶级超算系统作为竞赛平台,2014年引入了当时全球最快的超级计算机作为竞赛平台,2017年竞赛与国家超级计算无锡中心合作,将超级计算机神威·太湖之光作为竞赛平台。而本届大赛中,浪潮提供了近200台浪潮超算AI服务器NF5280M6,以及交换机等设备用于比赛。
最高计算性能奖获得者中山大学代表队设计了“4机8卡”的异构加速超算系统,共采用4台浪潮AI超算服务器NF5280M6配置8块NVIDIA A100加速卡。大赛让大学生可以实际动手操作全球最快的超级计算机并挑战尖端科学应用问题,充分激发年青人的科技创新热情。
(作者:李婷菊 编辑:李莹亮)
21世纪经济报道及其客户端所刊载内容的知识产权均属广东二十一世纪环球经济报社所有。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。