日期:[2022年01月04日] -- 每日经济新闻 -- 版次:[06]

超算终极形态是什么样子? 世界超算先驱陈世卿:未来超算应朝类脑方向发展

(开栏语:这是一个充满考验与变革的时代,这是一个紧密联结的命运共同体的时代。
  在这个疫情持续肆虐、抱团取暖的寒冬;在这个极端天气频发,气候剧变的前夜;在这个虚拟现实浪潮,汹涌扑面的时刻;我们无比需要科技的力量、理性的力量,我们深信唯有此,我们才能突破现实的困境,去探索更为广阔的世界,去追寻更加充盈的自我。
  这个时代的弓箭已经张开,最刚劲的科技之箭将飞驰而出!2022,我们推出开年巨献,触摸科技前沿,让我们一起去预见未来!)
 
 每经记者 谢陶 每经编辑 高涵
  一直以来,超级计算机都是科幻作品里经久不衰的热门元素——《终结者》《新世纪福音战士》《超体》中形态各异、高度人工智能化的超算,承载了人类关于量子世界及人脑潜力的想象。
  不久前,弗兰克·赫伯特(Frank Herbert)创作的史诗科幻小说《沙丘》被改编为同名电影,全球热映。电影中呈现了一个细节丰富的沙漠星球厄拉科斯(Arrakis),令人仿佛身临其境。
  一群研究气候模式的英国科学家被这颗陌生的星球深深吸引,试图模拟出厄拉科斯的气候环境。但是云层、温度、降水、风力等海量数据的繁复运算,非人力可为。于是这群科学家调用了一台超级计算机,让其日夜不停地处理数据,构建模型,最终得出赫伯特书中所设想的气候环境——很大程度上符合真实的气候模型。
  显然,上文所述只是超算力量的“冰山一隅”。从古气候研究、地震预警、地质勘探、再到星体运行轨迹推演,超算在众多领域展现出了神奇的力量,在持续推动产业变革的同时,不断拓展人类探索的边界。那么,在经过数十年的发展迭代后,未来的超级计算机将呈现出怎样的发展形态?脑机融合有哪些前沿的研究领域?中国超算在发展过程中还存在哪些短板?
  为此,《每日经济新闻》记者(以下简称NBD)独家对话美国国家工程院院士、美国艺术与科学院院士、享誉世界的超级计算机先驱陈世卿(Steve Chen)。陈世卿也是美国第三脑研究院创始人及院长,还是中国航天云网工业大数据应用技术国家工程实验室的首席科学家。
  上世纪八九十年代,陈世卿被视作世界超算领域的“超级巨星”,《时代周刊》曾将其作为封面人物。他师承NASA早期的超级计算机ILLIACIV的首席系统设计师大卫·库克(David Kuck),于1979年加入了大名鼎鼎的美国克雷公司(Cray Research),担任首席设计师和高级副总裁一职。
  作为全球著名的超级计算机专家,陈世卿做到了四个“世界第一”:1983年研制出世界上第一部2CPU并行向量式超级计算机(Cray XMP/2),由此奠定了世界上并行向量式超级计算机系统架构的基础;1998年研制出世界上第一个全新的超级计算机系统架构和应用理念—刀片式超级计算机(Blade Supercomputers);世界上第一个以超级计算机为基础、全球联网形成类似电流网格的信息网络;世界上第一个以互联网为基础、应用对应用、动态的、成本低、效率高的企业协同作业中间软件TONBU,极大地推动了全球超算的发展。
  “刀片式超级计算机的服务器就像‘刀片’一样,可插入机架式机箱内。一块‘刀片’就是一块系统主板,既可单独运行自己的系统服务于不同的用户群;也可以集合成服务群,共享资源,运行分配的单一任务。拥有高度并行、实时协作、低功耗、低售价、空间小等特点。”陈世卿介绍道。
  在谈到未来超算的发展趋势时,陈世卿告诉记者:“现在的超级计算机由于耗能太大,已经走到了一个发展瓶颈,未来超算将从集中式演变为分布式的,深入社区、街道、产业园区、大学和研究机构等。与此同时,超算与脑科学也将走向更加深度的融合。”
 
 “未来的超算应是分布式的,全世界变成一张网”
 
 NBD:目前,主流超级计算机基本上采用的都是集中式算力模式,在实现超强运算能力输出的背后存在哪些不足?未来的超算将是怎样的演变形态?
  陈世卿:上世纪80到90年代,我都只在做一件事情——发明和制造全世界最快的超级计算机。在我设计的系统架构基础之上,集中式超级计算机开始飞速发展,广泛应用于国防、石油、航天、航空、汽车、核电、气象、化工、材料、生物、制药等领域,例如美国AT&T、波音、通用、德国奔驰等都是我的客户。
  在全世界所有规模较大的超级计算机中,百分之八九十都是利用了我当时创造的系统架构与理念,从单机到双机,一变二、二变四、四变八,演变为上千的并行计算。
  但随着超级计算机体积越来越大,速度越来越快的同时,其耗能也越来越高。目前全世界速度前十名的超级计算机在运转时,需要一个至少20兆瓦规模的供电站来支持,每小时仅消耗电量就超过2万度,相当于一座小型城镇的日常消耗。
  虽然是我创造了集中式超级计算机架构,但其能耗巨大的难题始终无法攻克。如果没有国家或是大型企业经费支撑,这种模式很难持续,也很难广泛应用到未来数字经济的新场景之下。从国家层面来说,这种大型集中式超级计算机在探月、气象监测、石油勘探等领域依然有着巨大的需求。但从市场层面来看,由于其耗能巨大,许多中小型企业难以负担。
  于是,本世纪初,我开始重新思考另外一种系统架构——从集中式转向分布式。其核心目的就是让超级计算机在速度更快的同时,耗能更低。这是一个完全不同的领域。
  NBD:如何理解未来所有的超级计算机应该是一个庞大的“分布式网络”?
  陈世卿:我认为将来所有的超算都应是分布式的,辅以人工智能、大数据等技术,全世界变成一张网。这个网络的边缘/底层就是社区、街道、产业园区等,那里有所有应用的大数据,随时可以接入超算。这是一个全新的构想。
  目前,我们仍处在开拓网格式智能超算的试点阶段。比如说,将一座城市划分成5000或是50000个网格,每一条街道或每一个社区都可以设置一台小型的超级计算机,所有当地的数据都可以实时计算,转化,并服务于当地。然后所有的社区再结合起来,形成一张庞大的分布式网格。类似于现在的电网,在超算的分布式网络中,未来的算力、算容、算法也是分布式的,可以互补。
  例如,我们可以在上海嘉定设计的底层网格式智能超算,把各个社区的大数据集中上传;也可以在杭州的西湖区,构建网格式智能超算,将所有的城市变化数据化,将数据深入挖掘并整合在同一平台,再用于智能医疗、教育、交通、制造、文创、能源、金融、环保、安防等终端服务。
  NBD:作为一名跨越多个时代的顶尖科学家,从小型机、巨型机到超级计算机到云端电脑一系列的发展过程当中,您观察到人机交互的理念经历了怎样的转变?
  陈世卿:人机交互的理念经过了长期的演变。最早的人机交互都是集中式的、机械式的,把所有东西往那里一丢让超算帮忙运算。如今,人机交互理念已经从以前机械式、集中式过渡到了更加智能化、个人化的模式。
  未来的超算应该是更加靠近你的,更加个人化的。比如说你现在住的地方,你的社区旁边就有一个小型分布式的智能超算。它需要的数据来源于这个社区,其完整的应用场景也在这个社区,并服务于整个社区的人。
  假如某天,一名心脏病人突然倒在马路上。我们如何立即知道这名病人的心脏病患病类型?哪家医院有该类心脏病的专科医生并且离得最近?如何最快调度救护力量?这些都需要运用智能超算,对所有数据进行快速计算,包括病人状况,定位,路况,医院条件等。这是未来智能超算发展的重要方向和应用场景之一。
 
 “未来超算应朝类脑方向发展”
 
 NBD:除了分布式、网格化的趋势之外,未来超级计算机还将怎样迭代演变?
  陈世卿:我认为,未来的超级计算机还应朝着“类脑”的方向发展,体积小、运算速度快、能耗低。
  事实上,人脑的日常消耗不过25瓦,但它却能指挥约1000亿的神经元,每天处理巨量的信息。人脑,作为人体最微妙的智能器官,其“性能”比超级计算机更强。目前人脑的开发不过5%,如果能借助脑科学提升人脑开发,并将其与超算结合,将创造出极具价值的应用场景。
  NBD:您2013年就在硅谷准备成立第三脑研究院,并于2019年正式成立,聚焦脑机融合的研究。那么在您看来“第三脑”的核心理念是什么?目前围绕“第三脑”有哪些主要研究方向?
  陈世卿:事实上,十几年前我的研究方向就转向了类脑计算,希望依靠“弹性分配”令超级计算机可以像人的大脑一样低能耗、高效率,同时提升大脑的开发程度。这样的转向对我而言,无异于一场“自我革命”。
  除了大脑(第一脑)、小脑(第二脑),我们每个人都有一个“延伸”出来的“第三脑”。“第三脑”也叫仿生脑,是认知神经科学、生物信息科学、生物系统科学、生物工程科学、生命科学、临床医学、信息工程科学、超级计算机科学等相结合的综合性科学。依靠高度可信、安全、高效、分布式和协作式的超级网格云端平台,我们在全球展开了研发工作。
  目前,“第三脑”主要有四大研究方向——研究脑、保护脑、开发脑、延伸脑。开发脑领域的研究相对较为成熟。
  第一个方向是研究脑,深入了解脑的基础生物机制。只有了解清楚其基本架构,它为什么智能之后,我们才能进行类脑计算。想象一下,大脑指挥约1000亿个神经元,却只耗能25瓦,而其中一半的耗能只是为了大脑的生物需求。这样的结构充满了奥妙。
  第二个方向是保护脑,在对大脑进行深度研究之后,我们就知道了它有什么缺点和弱点,从而知道采取怎样的保护措施来防止脑损伤和针对脑疾病找到早期精准检测和干预的方法。我们的研究重点在于如何进行早期检测,从信息层面、物理层面、化学层面等提前预判并介入,降低发病风险,将治病的“窗口期”前移。
  第三个方向是开发脑,研究发展脑机融合的高效率学习方法。老天爷赐予我们这么聪明的大脑,我们应该重点研究如何将一个人的大脑潜力发挥出来,不被别的因素压抑住。
  我们曾在美国弗利蒙高中进行试点,最终证明“第三脑”相关技术可以显著提高学习速度和效果。我希望未来可以用我们的理论和技术,充分激发大脑的学习潜力,幼儿园到博士17岁左右就可以念完,再通过3年的社会实践,一个人到20岁左右就可以拥有博士级别的思考分析能力。“如同我虽然77岁了,但我大脑的年龄才30多岁,我现在的思考创新能力跟30多岁时不相上下。”
  最后一个方向则是延伸脑,将脑机融合的技术延伸到云端,实现从小到老,终生陪伴。
  NBD:如今,脑科学领域的研究早已站上科技圈的风口浪尖,特斯拉CEO埃隆·马斯克、Google创始人谢尔盖·布林等纷纷入局。那么,脑科学有哪些前沿的应用场景?
  陈世卿:以智能医疗领域为例,我们正与世界知名医学院校共同研究脑疾病与癌症预防,借助脑科学与人工智能实现“未卜先知”,提前诊断出疾病,在早期实现非侵入式的疾病治疗。
  譬如,根据脑视觉神经的研究,在阿兹海默症患者还没有开始丧失记忆之前,利用新开发的精密仪器早期检测出脑认知功能的下降,并进行非药物的物理干预和康复,提升个人生活品质。目前,帕金森综合症、自闭症、抑郁症、老年痴呆症、癫痫症,这5种脑疾病是智能医疗的攻坚项目。
  此外,以智能教育为例,我们希望从脑科学找到一个规律,可以很早就判断出一个儿童是适合科学型、技术型、工程型、艺术型还是医学型的学习教育。
  脑科学结合人工智能将变革未来的教育系统。中国目前第一次人口红利已经过去,以前我们靠劳动力密集型,现在社会进入到老龄化阶段,需要依靠科技的力量。而脑科学可以加快年轻人才释放到社会的速度,有助于实现第二次人口红利。
  NBD:此前,埃隆·马斯克在谈到脑机融合的时候,认为人类只有一个选择——成为人工智能(AI)。你怎样看待这样的说法?
  陈世卿:其实,马斯克有的时候表达得比较偏激了一点。他谈到的脑机融合、脑机接口技术是脑科学与AI技术的结合,通过植入芯片,帮助残障人士过正常的生活。
  但我认为脑科学另一个重要的发展方向是——激发大多数人的大脑潜力,促进思考创新。人脑是最聪明的,我们总能思考发明出一种新的工具来增强某方面的能力,就像是望远镜、显微镜之于人眼,汽车、飞机之于双腿。人工智能只是人“延伸”的一部分,光有人工智能是不够的,必须要深度结合脑科学。
  未来最好的人机交互,其实就是繁重庞杂的工作交由人工智能完成,再通过脑机融合技术,让我们的大脑专注于思考创新。
 
 “中国超算达到世界领先水平,但应用型人才短缺”
 
 NBD:多年以来,您的科研经历和中国有着千丝万缕的联系,促进了中国医疗健康大数据平台的发展成型。请分享下您当年在中国参与超算项目的经验。
  陈世卿:最早在2004年的时候,我决定回到中国,最初在深圳设计完成了我的第三代超级刀片计算机。当时并没有第一时间拿去卖,而是将新一代的超算带到了中国贫困边远的农村和少数民族地区。
  我们在这些地区设立了4个临床试点,包括河北张家口康保县、内蒙古的锡林郭勒盟、甘肃阿克塞的哈萨克族自治县等。我和团队花了7年的时间深入当地调研,收集挖掘了大量医疗数据,尤其是当地的慢性病大数据,成功建立起一个慢性病的信息网格模型,实现了县、乡、村三层基础医疗的互联互通,形成了今天中国慢性病医疗系统“医联体”的1.0版,也促进了早期农村的“新农合”医疗付费系统的发展完善。
  2007年,时任卫生部长高强视察张家口康保县,看到我们的医疗数据与网格模型后非常满意,“太好了,这才是中国未来的大健康平台。”后来在高强部长的推动下,200个县得到了国家医疗改革经费的积极资助,医疗大数据网格模型得以在更多地方推广,后来逐步变成了国家慢性病的管理平台。
 2006年至2012年那段时间,我整个工作重心都转移到了北京,独立融资组队,继续发展第4、5、6、7代刀片式超级计算机,并开发医院医疗软件,建立起了中国最早期的健康云计算、大数据服务平台。
  最初我们1.0版本的想法是将县、乡、村结合在一起,打造“医联体”。未来,我们希望全中国都是一张网,用一个健康码。人始终是流动的,但在一张网之下,不论走到哪里,你的慢性病,你的家族病史都可以及时准确地全部调出来。
  NBD:近年来,中国在TOP500高性能超级计算机的数量上,逐步在全球占据制高点,以“神威·太湖之光”和“天河二号”为代表的超算屡次在算力上领先全球。根据您的观察,中国的超级计算机在全球处于什么样的水平?
  陈世卿:其实,从系统设计、生产制造上来看,中国已经处于前沿的水平了。全球排名前十的超级计算机里面有不少来自中国。例如不久前,在全球超级计算大会上,由之江实验室牵头的中国超算应用团队,凭借新一代神威超级计算机研发的量子计算模拟器——“超大规模量子随机电路实时模拟”(SWQSIM)获得了超级计算应用领域国际最高奖项——2021年度“戈登·贝尔”奖。这是中国超算发展水平的集中缩影之一。
  NBD:那么,中国目前在超算的发展上还存在哪些短板?
  陈世卿:首先是中国的超算应用型人才不足。中国培养的人才集中在中科院等大型机构院所,主要研究集中式超算,领域相对较窄,而且也只有国家机构能够负担。
  未来的分布式智能超算将会是一个个分散到社区、街道、产业园区的小型超算,将会有更多更为细分、复杂的应用场景。鉴于此,中国的人工智能应用型人才还存在很大的缺口,目前至少需要500万相关的开发人才。此前,我们在成都锦城学院成立了人工智能学院,希望培养更多中高端的应用开发人才,并计划将成功的培养模式,复制到一百所高校。
  另外就是市场在谈超算的时候,谈具体产业和产品比较多,很少有人谈算力算容。实际上,中国的智能超算发展,在算力算容上是一个较大的缺口。未来所有的人工智能场景都需要算法,而算法需要算力支持,这块需要大力开发。
  目前,有的城市意识到发展以人工智能为代表的数字经济的核心在于算力,已经开始了相关布局,华为、浪潮等企业也在参与城市算力算容的建设。中国应该要以产业园区、社区为核心,布局5G基站等新型基础设施和算力,为中小企业创新发展营造良好的配套环境。
  最后,只有将脑科学、人工智能和智能超算结合在一起,才能完成从端到边缘的应用场景,建立起完整的产业链。
  NBD:最后一个问题,从最初加入垄断世界超级电脑市场的克雷公司,到与创始人西摩·克雷分道扬镳中间你们经历了什么?作为一名顶尖科学家,同时也是资深创业者,您如何在技术探索与商业之间保持平衡?
  陈世卿:因为他研究的超算系统被我超过了(笑)。当时,我的第二代超算研制出来了,他的第二代还没出来。慢慢地,整个公司的营收全都“依靠我的产品”。
  事实上,研发每一代超算都要花很多钱,去支撑上百人的研发团队。当时公司并不能支撑两个都在“烧钱”的研发团队。一方面,克雷毕竟是创始人,公司一定要优先支持他的想法和研究;另一方面,我为公司带来大量的商业利益,却依然没法筹集到足够的后续研发基金。久而久之,我俩就“分离”了,后来我主动带着45个工程师的研究团队离开了公司。
  一直以来,我都是探索前沿领域比较多。我的超算当然能够创造可观的收益,但我又将其投入到了下一个研究。研究—新产品面世—商业变现—再研究,如此循环往复。
  我的人生观就是,将我的科研成果惠及更多的老百姓,不管是中国人还是美国人,全世界都需要帮忙,能做到这一点就很好!我希望从事科技行业的人能够实现自己的理念与价值。做科研的目的不是为了赚钱,而是为了让技术红利惠及所有的人,帮助社会底层的人们解决困难。科技之道,同沾雨泽!