课题组在国际权威期刊Joule和Cell Reports Physical Science等Cell子刊相继发表关于人工智能与大模型助力电池加速研发的研究工作。系列工作分别得到了昆山杜克李昕教授团队、复旦大学微电子学院陶俊教授团队、浙江大学艺术与考古学院唐谈研究员等合作团队的支持。
第一篇题为“Semi-supervised learning for explainable few-shot battery lifetime prediction”发表于Joule,2024, 8, 1-17 由于锂电池具有能量密度高、使用寿命长等优点,当前已被广泛应用于电动汽车、手机等各个领域,在现代社会中起着至关重要的作用。为了保证电池系统的安全可持续运行,人们需要对锂电池寿命进行准确的预测,以便有效管理其健康状态。传统的基于物理和半经验模型的预测方法易受误差影响,精度十分有限。近年来,尽管数据驱动的寿命预测方法在技术上取得了显著进步,但由于缺乏足够多的标记数据,其模型的准确性依然受到严重制约。
图1. 电池寿命预测算法:传统监督学习方法完全依赖标签数据,耗时耗能 vs.半监督学习方法,利用易获取的无标签数据,降本增效
针对上述挑战,合作团队提出了利用无标签数据进行半监督学习的电池寿命预测方法——部分贝叶斯协同训练(PBCT)。这里的无标签数据是指那些未包含寿命测量信息的电池测试记录。实际上,无论是在锂离子电池的制造阶段、使用过程还是维护期间,都存在海量的无标签数据。这些数据易于获取,数量巨大,且数据模式统一,无需担心由于错误假设或跨领域测试差异带来的各种问题。PBCT充分利用了这些低成本且丰富的无标签数据,通过提取其中的隐藏信息,深化了对底层数据模式的认识,进而显著提升了电池寿命预测的精确度。与现有的方法相比,PBCT在寿命预测精度上取得了高达20%的提升,且几乎无需额外的数据采集成本。因此,在同样预测精度的前提下,PBCT可以大幅度降低数据采集成本。此外,该研究还发现,将无标签数据纳入训练过程中,有助于揭示影响电池寿命的关键因素,这些因素在仅对标记数据进行分析时往往会被忽略。因此,PBCT这一半监督学习技术,为高效且具备可解释性的数据驱动电池状态估计开辟了新的路径,引领了未来的研究方向。
第二篇题为“Potential to transform words to watts with large language models in battery research”, Cell Reports Physical Science, 5, 101844, 2024 此文聚焦于在改进能源存储技术中使用AI驱动的大语言模型,该技术有望广泛应用于电动汽车和电网储能等行业。本文使用大模型,整合了海量学习资源,提出了多模态加速电池研发的新研究范式。一般的大型语言模型缺乏回答有关特定技术的专业问题所需的专业知识,可能导致查询答案的潜在不准确性。在本文中,团队提出并证实从指定来源搜集信息的定制模型可以克服大语言模型的“幻觉”问题。论文中训练了一个名为BatteryGPT的大型语言模型,以锂离子电池的超级快充为展示场景,这个模型将从一个快速充电数据库中获取信息,该数据库是一个包含针对该研究领域的研究文献、讲座和其他高质量信息的仓库。BatteryGPT能够提供专家级别的回复,并展示了模型精准定位最前沿的电池快充技术的能力,以达到大模型加速电池研发并丰富科学研究的过程。
图2. 利用大语言模型结合多模态加速电池研发的新科学研究范式
半监督学习加速电池研发论文网址:https://www.cell.com/cell-reports-physical-science/fulltext/S2666-3864(24)00069-9?rss=yes
大模型加速电池研发论文网址:https://www.sciencedirect.com/science/article/pii/S254243512400103X?via%3Dihub