探索AI for Science“复旦范式”

3数字上海

·探索AI for Science“复旦范式”

探索AI for Science“复旦范式”

国内高校最大云上科研智算平台CFFF“上海制造”

IT时报记者范昕茹
　　近日，由复旦大学与阿里云、中国电信共同打造，为发现和解决复杂科学问题而建的科研“超级计算机”——智算平台CFFF（Computing for the Future at Fudan）在复旦大学正式上线。“在数据和智能技术驱动的‘大科学时代’，如何在日新月异的科技创新环境中赢得主动，在关键领域取得创新突破，是时代赋予高校的命题。”在复旦大学校长、中国科学院院士金力看来，以CFFF平台为代表的智算平台作为一种新兴的科研超算架构，将成为科研的重要支撑力量，极大提升科研效率、降低科研成本，加速科学原理发现和技术突破，并有力推动AI for Science时代的到来。
　　CFFF成为数字上海的又一重要算力底座。
科研已离不开算力
　　随着科学技术的高速发展，科研范式也随之更新迭代。“从学科发展的历史来看，世界科学的发展经历过四个阶段的演化发展历程。”金力介绍，世界科学从通过实验描述自然现象的经验范式，到通过模型或归纳进行研究的理论范式，再到应用计算机仿真模拟解决学科问题的计算范式，最终发展到通过大数据分析研究事物内在关系的数据范式。“每当科研范式存在难以解释的科学发现或者难以解决的问题，逐渐积累到引发质变时，新的科研范式就会呼之欲出。”金力接着说，“大数据越来越大，需要求解的科学问题日益复杂，科学研究正在探索‘第五范式’：即在数据范式的基础上，引入智能技术，强调人的决策机制与数据分析的融合，将数据科学和计算智能有效结合起来。”“第五范式”以数据驱动和智能技术驱动的内在特征，对高校的技术能力提出了更高要求。“‘单打独斗’已不适应大科学时代的科技创新，”金力说，“我们现在常提‘有组织科研’，就在于通过布局建设大平台。”在他看来，以大规模异构算力为基础的智能计算平台将成为今后科研的重要支撑力量。智算平台能够为高性能计算提供强大的计算资源，支持AI赋能科研的新范式。而通过AI for Science的跨学科研究可以推动基础学科及交叉学科建设，实现科研成果的深度融合和转化。
　　如今，在机器学习与超算越来越趋于融合的势头下，GPU+CPU结合的异构计算架构已成为新兴的超算架构。
　　早在2020年，高性能计算应用领域最高奖项“戈登贝尔奖”就授予了美国科研团队在由2.7万块GPU和2.7万块CPU为核心构建的超算集群Summit上的分子动力学研究。自此，大量前沿科学攻关，包括蛋白质计算、药物筛选、自动驾驶及车联网、计算物理学、复杂系统科学、大气海洋地球系统模拟、气候变化综合评估模型模拟、人工智能基础大模型训练等，都严重依赖高端GPU算力资源。
　　而这，也正是复旦大学打造以大规模异构算力为基础的智能计算平台的原因所在。
专职科研的“超级计算机”
　　CFFF智算平台就是复旦直面AI时代，探索科研新范式的成果之一。
　　CFFF平台由面向多学科融合创新的AI for Science智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号两部分组成。其名字灵感来自复旦大学“博学而笃志，切问而近思”的校训。
　　这是一台真正为科研而生的“超级计算机”。复旦大学人工智能创新与产业研究院院长漆远介绍说，“近思”一号和“切问”一号一个部署在复旦校内，一个托管在1500公里外的阿里云乌兰察布数据中心。尽管两者相距甚远，但百G高速数据传输网和阿里云大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术，让CFFF平台连成了一台真正意义上的“超级计算机”。复旦四校区的所有实验设备都能高速接入，做到异构算力统一管理，计算任务统一调度，满足不同应用场景下的科学智能研究与应用需求。
　　CFFF智算平台拥有国内高校最大规模的多级数据冷热分层存储集群，这也帮助高校解决了长期存在的海量科研数据无法长期备份的痛点。不仅如此，作为我国高校中排名第一的超算集群，同时也是算力第一的异构智算集群，CFFF智能计算平台具有大规模、高能级的特点。它可以实现超1000卡并行智能计算，支持超1000亿参数的大模型训练。
　　不过，尽管同属于一台“超级计算机”，但“切问”和“近思”却肩负着不同的使命和责任。“切问”一号侧重于提供高性能科学与工程计算，利用人工智能向基础学科的前沿领域发问；而“近思”一号则侧重高性能计算和大规模的数据处理能力。
　　它们擅长的学科领域和问题也有所区别。“切问”一号更专注于基础学科及多学科交叉领域的前沿研究，求问远方。而“近思”一号更多地专注于眼前应用，寻求在计算物理学、新能源新材料科学、大气海洋科学、地球科学、生物信息、医学健康、微电子、航空航天科学等学科的落地。
新的风暴正在生成
　　一只蝴蝶在亚马逊雨林一棵树上振翅，可能会引发一场跨越大洋的风暴。而CFFF智算平台的这次振翅，已经在复旦校园中生成一场小小的旋风。
　　李昊是复旦大学人工智能创新与产业研究院的研究员。CFFF智算平台正式上线前夕，他刚带领团队发布了中短期天气预报大模型——伏羲。这个拥有45亿参数量的大模型将天气预报的预测速度从小时级缩短到了3秒内，预测效果在公开数据集上首次达到业界公认的ECMWF（欧洲中期天气预报中心）集合平均水平。更让人难以想象的是，这样一个大模型的训练只花了一天时间。
　　伏羲是CFFF平台孕育出的第一个大模型。对复旦而言，它的诞生意味着复旦对科研的探索正式迈向“第五范式”。
　　从计算驱动转向数据驱动是科研从第三范式迈入第四范式的表征，而是否利用AI等新技术，则是第四范式和第五范式的分水岭。在天气预报领域，现有的中短期天气预报一般采用数值预报的方式进行。即基于大气动力方程和物理过程参数化，通过计算机仿真的方式对大气过程进行模拟，从而预测未来一段时间的气象情况，这是典型的计算驱动。
　　伏羲则不然，它的内核是数据驱动，但同时，它还采用了人工智能大模型的方法。李昊解释说，伏羲的原理是将全球分为一个一个的三维小网格，每个网格内都包含温度、湿度、降水等几个气象要素，从而形成多个时刻的三维数据序列。“我们会根据此前的数据，比如当前时刻的全球气象要素以及6小时前的数据，来预测未来的序列，”李昊解释说，“它可以被看作是一个时序预测问题。”
　　这意味着，伏羲未来不仅可以被用在天气预报上，还有可能被用在其他时序预测问题上。比如为智能驾驶汽车做一些行为预测、预测股票市场的走势等。
　　最近，李昊刮起的这股旋风慢慢地吹到了其他学科。复旦大学大数据研究院青年副研究员周阳就在思考，利用算力和数据，去刻画整个社会的运行方式是否可行。“原来大家可能有很多好的想法，但是苦于没有软硬件融合平台的帮助，就没有办法将一个灵感或者想法变成现实。”周阳说，“有了这样一个平台，就可以解决算力方面的要求。”
　　不过，这一切才刚刚开始。未来，CFFF智算平台还将引发新的风暴。金力说：“希望基于CFFF平台，能够在复旦建成一批具有世界级影响力的科学大模型，例如生命科学大模型、大气科学大模型、材料科学大模型、集成电路大模型等。”