我国发布首个亿级参数量 地震波大模型
7月28日,“谛听”地震波大模型在四川成都发布,该大模型由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。
成都超算中心运营管理有限公司董事长郭黎介绍,2023年9月,国家超级计算成都中心与中国地震局地球物理研究所合作共建了“地震大模型创新应用联合实验室”,与清华大学、中国科学院地质与地球物理研究所合作启动了“谛听”地震波大模型的训练。“谛听”数据集是国内首个,也是目前国内外最大规模、样本类型和标注最为全面的地震学专业AI训练数据集之一,半年多时间里,实验室研究人员利用“谛听”数据集获得了首个亿级参数量的地震波大模型。
“长期来看,地震学是一门观测科学,重大突破往往来自对观测数据的深刻理解。”中国地震局地球物理研究所副所长陈石介绍,目前,传统方法和中小模型均无法充分利用百TB、千TB级别的地震观测数据,而这些数据对地震学研究有重要意义,只有通过大模型才能深入挖掘。
“‘谛听’大模型依托海量数据,通过先进的人工智能技术,已经显著提升了地震信号的识别准确率和速度。”陈石说。
国家超算成都中心常务副主任王建波介绍,“谛听”地震波大模型对于突破中小地震波模型性能瓶颈,提高地震大数据智能处理能力和信息挖掘水平具有重要意义,国家超算成都中心正不断加速人工智能技术在防灾减灾、智慧城市等领域的应用与发展。据了解,目前“谛听”地震波大模型已可投入使用,十亿参数量级的版本预计2024年8月完成预训练。未来,该大模型还可用于矿震监测、城市地下空间结构探测、海底地震监测等多个领域。
(文章来源: 新华网 )