人工智能提速新材料发现 | YOSIA Webinar AI+ 材料科学 回顾

作者: 编辑:米老猫

来源: 未来论坛

发布日期: 2020-09-16 12:07:58

文章回顾了未来论坛YOSIA Webinar第五期“AI+材料科学”的活动,探讨了人工智能在加速新材料发现中的应用,邀请了多位专家分享他们的研究成果和观点,讨论了AI在材料科学中的价值和挑战,以及如何整合和充分利用现有的基础设施。

传统的材料研发模式主要依赖“试错”的实验方案或偶然性的发现,其研发过程一般长达10-20年,在很大程度上已经无法满足21世纪工业发展对新材料的需求。随着信息科技的逐渐成熟,人类通过计算系统或人工智能发现新材料成为可能。人工智能和材料科学的结合充满前景,但依然存在挑战。

2020年8月30日,未来论坛YOSIA Webinar第五期“AI+材料科学”邀请了材料计算学、材料表征及材料基因组学的学者,围绕“人工智能提速新材料发现”的主题,分享如何利用人工智能加速对材料结构和性能的了解,并与传统材料研究的学术界和产业界代表,一同探讨AI应用于材料科学研究的价值和效能。

主持嘉宾:周华,美国阿贡国家实验室物理学家。

主讲嘉宾:汪洪,上海交通大学材料基因组联合研究中心主任,“致远”讲席教授,中国材料试验标准委员会(CSTM)材料基因工程领域委员会主任委员。刘宜晋,美国SLAC国家加速器实验室斯坦福同步辐射光源Lead Scientist。胡嘉冕,美国威斯康星大学麦迪逊分校材料科学与工程系助理教授。刘淼,中国科学院物理研究所特聘研究员,博士生导师,atomly.net创始人。

讨论嘉宾:尹万健,苏州大学能源与材料创新研究院教授,博士生导师。

主题分享:汪洪报告主要介绍了以“大数据+人工智能”为标志的数据驱动模式对材料基因工程领域的重要性。刘宜晋报告结合机器学习和数据挖掘这些先进的计算方法,讲述可我们如何更好地应用X射线大科学装置,推进材料科学的前沿探索。胡嘉冕报告主要分享了对以下三个问题的见解:(1)哪些情况下用机器学习最为必要?

(2)怎样根据具体情况选择合适的机器学习方法?(3)有哪些可能的未来发展方向又分别存在哪些挑战?刘淼报告首先介绍了材料数据的重要性以及目前的国际趋势,然后分享了中科院物理所近期研发的Atomly材料科学数据库的进展和未来的目标。

尹万健教授观点分享:我是物理背景出身,我们做计算物理都是在已知的物理定律的条件下来解特定的方程,过去认为机器学习可能就是较为复杂的统计的拟合,并不认为它能够有什么根本性的发现。但Alpha Go战胜了人类顶尖棋手李世石这件事情给大家带来了很大冲击,包括我自己。

之前我一直在做钙钛矿太阳能电池的理论计算研究,钙钛矿这个体系因为材料种类很多,恰好是AI和材料交叉研究比较好的模型体系,我们首先在数据库里做了分析,我们在一万多种可能的材料中,筛选出了300多种稳定材料,在过去通过基于密度泛函理论的第一性原理计算,这个计算量是很大的,而通过高通量计算加机器学习,把计算量大大减小的下来我们通过查找资料,发现这300多种材料虽然在数据库里不存在,但是上世纪六七十年代很多科学家已经把这些材料合成出来,跟我的理论计算对比,它的准确度达到95%以上。

主题讨论环节:议题一:如何整合和充分利用已有的但分布式布局的各种基础设施,使之成为一个新的以数据为中心的材料基因组集成平台?汪洪:现在各个国家建立了很多可以称为平台的机构,这与我们的长远目标是完全一致的,这些平台本身都具有产生数据的能力。议题二:高通量实验表征的设计与实施应该如何选取和优化?它的挑战和应对策略分别是什么?

刘宜晋:高通量实验表征包含两种不同类型,第一种类型是自动化、高效率测试大量不同材料,用这种方式搜索参数空间,寻找最优化组合。议题三:从利用人工智能机器学习来提速材料设计的角度,性能需求反溯微结构设计为导向还是微结构设计优化而预测性能为导向会更能发挥AI、机器学习的优势所在?胡嘉冕:这两个问题并不矛盾,材料设计应以优化性能为导向,以找到合适的原材料和材料制备工艺为目的。

议题四:Atomly.net数据库和Materials Project之间有什么样的区别和联系?刘淼:首先高通量计算是一种方法,它不仅仅只是数据库,所以我们想建立的是这样一套方法。议题五:如何将与材料合成相关的庞杂内容整合到材料计算预测和高通量实验表征的环节里面去?刘淼:第四范式就是材料数据的积累去改变从前个人经验积累的模式。议题六:描述子的构建如何能更反映材料构效更本质的规律?

尹万健:要做机器学习,数据质量非常关键。

开放式讨论:Q:材料科研界和工业界的合作目前还比较松散,这种紧密合作目前的最大挑战和难度是什么?材料科学家在推动这一进程中能做些什么?汪洪:我们在做材料基因组的最终目标就是要应用,所以我们跟很多的企业建立了联系,而且有很多的沟通。刘淼:我想这是一个业界的共同问题,并不仅仅限于材料领域或者AI领域,我们和产业结合,彼此互为支撑的关系。

Q:在学术界或科研界内部,如何能有效的实现AI+材料研究的数据共享?汪洪:材料界有一个共识,急需要有一个交换机制。Q:人工智能或机器学习能否对材料合成方法和路径做一定的预测或规划?

刘淼:比如伯克利的Ceder团队试图用机器学习读文献,他们的数据库里已经有300万个文献,将300万个材料合成方法范例之后和计算数据做吻合,机器学习可以提取出一些材料的合成方式,那么其他的新材料就可以用这个模型去预测,我认为这是业界最领先的方式。Q:机器学习能否对亚稳状态的材料合成有所帮助?刘淼:这需要具体问题具体分析,总体就是如果有足够多的数据,数据质量足够高,多少会给出一些洞察。

Q:用数据驱动来进行研究可能解释性比较差,甚至要改写材料科学的基础理论,我们该如何推进材料科学理论的进步?尹万健:我们的物理定律是人类几百年来慢慢总结和发现的规律,这些规律是不是能够代表全部?这是一个根本性问题。胡嘉冕:举一个机器学习预测有机分子性能的例子。研究人员通过机器学习定量分析了分子中每一个原子对最后结果的贡献度。

刘宜晋:机器学习可以帮助我们捕捉到大量数据里面的蛛丝马迹,从而了解一些原来没有预想到的化学反应。Q:针对材料物质科学的年轻学生和刚加入这个领域的新生力量的,他们需要有怎样的准备,训练和积累来迎接材料探索开发新时代的到来?

汪洪:现在的同学们随着计算机一起成长,对于未来要进入材料科学的同学来说,计算机技术是非常重要的一环,今后的学生,除了要打牢物理、数学、材料的基础,学习计算机、学习编程对于未来会有极大的帮助。刘宜晋:我们做研究必须得从自己的专业出发,一开始不要追求很复杂先进的算法,从小问题逐步开始,一切皆有可能,但是要明确自己的未来发展方向。

尹万健:我经常和我的学生说,千万不要追求大而全,也许我们做的工作,方式不是最完美,算法不是最好,但是一定要想我们是要解决什么科学问题,你把自己定位成什么很重要。刘淼:我建议比较年轻的同学或者从业者尽早规划自己的职业,只要找到自己的热爱,剩下的问题迎刃而解了。

UUID: f5d601cd-e81a-48cc-b5cc-f75434afaf02

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2020/中科院物理所_2020-09-16_人工智能提速新材料发现 | YOSIA Webinar AI+材料科学 回顾.txt

是否为广告: 否

处理费用: 0.0132 元