科学计算拥抱开源,飞桨助力前沿基础科学研究

“循思想自由原则,取兼容并包主义”,无论是100年前,还是100年后。

从北大元培到普林斯顿,再次回到中国的张林峰有了新的身份。作为深势科技这家公司的联合创始人和首席科学家,他和一群志同道合的伙伴正在以“多尺度建模+机器学习+高性能计算”的新范式,解决着微观尺度的工业设计难题。作为涉及前沿交叉学科的典型企业,张林峰每每在介绍公司时,总难用三言两语解释清楚,所以他总是乐于先提到那个“因共同热情与理想”聚集起来的开源新社区——DeepModeling。

DeepModeling开源社区始于张林峰学生时期所做的“深度势能分子动力学”开源项目DeePMD-kit。“开源”即“开放源代码”,意思是指用户可以在彼此所写的源代码上修改和学习。开源社区模式在计算机和电子工业历史上早有实现,DeepModeling是将这种想法借鉴到了科学计算领域,将基础代码、算法、架构等根据开源协议进行共享,通过社区内的群智协作,让高门槛、高壁垒的不同学科碰撞思维,交叉协作,打通盲点,为传统科研带来了新的研究范式。

“科学计算以及物理模拟会是人工智能下一个非常重要的战场,在这样大的场景下,开源将是我们注定要选择的模式。”张林峰在WAVE SUMMIT2021深度学习开发者峰会的论坛上分享分子动力学与飞桨深度学习平台的融合创新时,提出了自己的观点。

事实上,当AI技术特别是深度学习,为处于前沿领域中那些由计算求解的问题打开了一扇新“窗户”时,复杂问题往往有了更有效的求解方式。

深势科技所做的,恰恰就是围绕一切涉及微观世界的“分子动力”进行聪明而富有价值的计算。比如做物理模型的求解,或是模拟化学反应中底层分子动力学或电子的结构。面对这些具有多元素、多特征的复杂计算,深度学习天然就能发挥系统性的优势。

张林峰解释说:“可以用底层的分子动力学举个例子,比如我们需要描述一个化学反应中,各原子间出现复杂的相互作用时,以前要么是通过更为复杂昂贵的量子力学计算求解,要么就简单地凭经验拍脑袋猜会是怎样的情况。但这个问题一旦被转化到深度学习的语言里面,就变成了‘输入原子位置’,然后‘求解原子间的相互作用结果’,也就是势能面。充分考虑物理限制的深度学习模型相比传统手段更高效准确。”

“因为深度学习具有强大的特征表达能力,它能够准确地把原子间相互作用的特征进行提取表达,并不断自我精进学习。深度学习在不同尺度的物理模型求解上,可以说有望解决所谓的‘维数灾难(注:指涉及到向量的计算的问题中,随着维数的增加,计算量呈指数倍增长,变得更为复杂的一种现象)问题’,把以前人们认为非常复杂、难以表述的函数,用深度神经网络这样的方式智能地表示出来,让人类更容易理解物理的微观世界到底发生了什么,从而更好的理解和规划我们看到的化学现象和物理现象等。”如此一来,航空、航天、气候、能源、材料、安全、天文、医药等领域的变化必将随之发生,诸如电动智能汽车更高效安全的电池设计、医药免疫更快速安全的新药研发等等似乎就近在眼前。

作为既有深厚的开源文化,又在技术上足够灵活、拓展能力极强的深度学习框架飞桨,能和深势科技“走到一起”并不奇怪。不久前,飞桨已和DeepModeling开源社区的开发者们,就深度势能分子动力学开源项目(DeePMD-kit)进行了跨领域深度合作。依托飞桨框架成熟的底层功能和动静统一的开发体验,开发者们实现了深度势能分子动力学模型的构建和运行。这一合作促进了双方在开发者生态上的双向融合,拓展了DeePMD-kit原有能力边界,增强了在国产化硬件和大规模分布式训练上的能力,也让飞桨支持的科学计算开源项目中增加了重量级的一员。

(飞桨深度学习开源开放平台全景图)

今年5月20日的WAVE SUMMIT2021深度学习开发者峰会上,百度再次发布飞桨的全面升级,正式发布了飞桨框架2.1版本。其中,对自动混合精度、动态图、高层API等进行了优化和增强,尤其是对自定义算子功能全面升级,不仅做了更好的封装,还打通了训练和部署,并将其变为飞桨的API之一,整体降低了开发者自定义算子的学习与开发成本,大幅提升开发灵活性,也为飞桨未来更多的跨界带来了巨大的想象空间。不同学科的开发者都能方便的使用飞桨做开发,产业应用将从成熟的AI行业延伸到生物、物理、化学等大科学领域,助力前沿科学研究。

对于飞桨来说,作为“AI时代的操作系统”、百度大脑的技术底座,始终坚持开源的路线,保持对繁荣开源生态的建设投入。截止目前,飞桨生态凝聚了超过320万开发者,服务 12万家企业,覆盖农业、工业、林业、民生、通信、电力、公益、城市管理等数十个行业,创造了36万个模型。

开源开放的精神内涵已不只是技术开发领域的协作机制,更是驱动技术创新和加速产业发展的核心动能。一如DeepModeling在开源社区宣言中所写:以开源社区的方式协同开发将使每个人的工作更高效、及时、可靠、透明。这种紧密合作、相互成就的精神也必将激励越来越多的人推动计算的发展、造福人类社会。这是一个振奋人心的机会,这是科学计算的未来。而事实上,这很有可能就是未来。

登录github或gitee搜索DeepModeling可访问社区。

原文链接:https://baijiahao.baidu.com/s?id=1701988098824872438&wfr=spider&for=pc

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享