
本期概要
1、利用密集阵列监测威远页岩气田的诱发地震
研究通过布设245个节点的密集地震阵列,结合机器学习定位方法,构建了包含近3万个事件的高分辨率目录。分析揭示了南部地震活动受流体注入驱动,而北部则与先存断层活化相关,为页岩气开发区的长期灾害评估与风险管控提供了重要科学依据。
2、基于机器学习的2009年拉奎拉地震序列的高分辨率数据集
研究应用PhaseNet等机器学习算法处理2009年拉奎拉地震序列数据,检测到约19万个事件,并经重新定位得到包含14.8万个事件的高清目录。该目录显著提升了断层几何形态与余震分布的分辨率,为理解复杂断层系统的地震活动演化提供了新见解。
3、通过并行符号枚举发现物理规律
研究提出并行符号枚举(PSE)新方法,通过共享子树计算与GPU并行化,大幅提升了从数据中搜索数学表达式的效率与准确性。该方法在多个基准测试和真实物理系统建模中表现卓越,为高效、可解释的数据驱动科学发现提供了强大工具。
利用密集阵列监测威远页岩气田的诱发地震
了解诱发地震的机制并评估相关危害对于降低页岩气生产区的风险至关重要。威远页岩气田(WSGF)是一个活跃的开发区,曾发生过高达Mw5.0的诱发地震。从2022年8月到2023年2月,来自多个机构的研究人员维护了一个含245个节点台站的密集阵列(该阵列覆盖整个威远页岩气田),节点平均间距约为3 km。利用LOC-FLOW(一种基于机器学习的地震定位方法),研究人员构建了一个高分辨率地震目录,精确定位了29 669个地震事件,震级范围从ML−1.35到ML3.42,完整性震级(Mc)为−0.24。地震活动形成了五个不同的地震群(R1—R5),威远页岩气田南部的地震活动紧密围绕水力压裂井,并表现出与孔隙压力扩散一致的迁移模式。相比之下,北部的地震活动表现出断层活化的特征,事件与先前存在的地质构造相一致。此外,该研究在2019年Mw5.0地震震中附近观测到持续的地震活动,表明余震序列将持续很长时间。研究结果强调了在页岩气田进行高分辨率地震监测和长期灾害评估的必要性。这些结果有助于更好地理解流体注入诱发的地震活动和断层活化过程,为构造敏感地区的风险缓解和资源可持续开发提供宝贵见解。相关研究发表在2025年9月的Tectonophysics。
随着全球能源需求增长,页岩气成为缓解能源短缺的重要资源,但水力压裂(HF)诱发的地震活动对居民与作业安全构成严重威胁。尽管对诱发地震机制已有研究,但由于地下结构复杂、触发机理及断层性质认识不足,风险管理仍具挑战。近年来,高密度临时地震阵列广泛用于水力压裂区域,可显著改善震源定位与地下结构的成像精度,揭示地震迁移和应力演化特征。

图1 (a)四川盆地(含页岩气区块)地图,以及2009—2024年已报告的地震(M≥4);(b)威远页岩气田地图
四川盆地的威远页岩气田(WSGF)是中国最大页岩气储区,自2015年大规模压裂以来,地震活动显著增强,已发生多次高于Mw4.0的地震,其中2019年Mw4.6地震为水力压裂引发的首个致命事件,Mw5.0地震为全球水力压裂诱发的最大地震之一。
研究人员聚焦于四川威远页岩气田的人为诱发地震监测与成因分析,利用机器学习与自动化算法(PhaseNet、REAL、GrowClust 等)构建LOC-FLOW工作流,从连续波形数据中检测、定位地震事件,建立了高分辨率地震目录。通过震源重新定位与波形幅度校正,分析了地震的时空分布特征。
研究人员通过LOC-FLOW重新定位了29 669个地震(共检测到42 497个事件),Mc为−0.24。其中,74%的地震分布在南部,说明南部地震活动非常活跃。相比之下,北部的地震活动不是很活跃,且深度较浅。地震活动的时空分布呈现出明显的聚集模式:在威远地块南部,所有地震群均是新出现的,且与水力压裂井密切相关。地震群的迁移模式呈现出明显的抛物线特征,表明孔隙压力扩散是潜在的触发机制。估算的水力扩散系数范围为0.006~0.16 m²/s,处于合理范围,并沿模拟的扩散前沿捕捉到了大多数地震事件。相比之下,威远地块北部的大多数地震活动发生在先前存在的断层上。这表明,威远页岩气田中存在流体诱发和应力驱动两种地震触发机制。此外,在2019年Mw5.0地震破裂带附近观测到持续性余震(也就是说,这些余震活动超过三年)。因此认为,在页岩气产区的灾害评估和风险减缓策略中,应考虑此类延迟地震响应。

图2 使用REAL算法进行事件关联。(a)42 497个关联事件的走时与震源距离关系;(b)一个示例地震(ML1.46),通过REAL关联,其P波(红线)和S波(蓝线)到时由PhaseNet 采集
1. 重新定位后地震活动的空间分布和迁移模式
研究人员对威远页岩气田重新定位后的地震活动的空间分布和迁移模式进行了分析,揭示了水力压裂过程、既有断层构造和地下流体运移之间的复杂相互作用。水平方向上,新发现的R1—R3地震群与水力压裂井密切相关,揭示了潜在断层和/或裂缝的活化。这些地震群的主要走向为东北和西北,与斜向挤压下共轭剪切裂缝的预期走向一致。从深度上看,地震活动从北向南逐渐加深,这与整个气田目标页岩层(即五峰组-龙马溪组)的深度增加相对应。此外,地震活动迁移模式为了解威远西南地区的压裂作业提供了间接视角,因为该地区缺乏直接的工业活动数据。例如,R1—R3群的时空演变可能反映了高压作业的月度迁移情况。
在威远北部和威远南部观测到了几种不同的地震活动迁移行为,其时间和空间特征各不相同:①R1—R3群:R1群中地震活动的复杂时空分布可能受到多个注入井的影响。孔隙压力通过高渗透通道扩散似乎是F1和F7子断层地震的主要触发机制,抛物线型地震迁移模式证明了这一点。较高的b值也表明,注入诱发新断层和/或裂缝的地震活动,这与先前研究表明该地区缺乏显著的先存断层相一致。同样,在R2和R3中所观察到的扩散型迁移模式也暗示,这些地震主要由孔隙压力传播驱动。空间分段序列表明,先前存在的裂缝被注入的流体依次重新激活。②R4 群:与R1—R3不同,R4群与先前三维地震勘探成像的断层系统相关,该断层系统横跨约15 km长的断层,并被分割成三个区域。R4的地震活动并未表现出明显的扩散式迁移模式(若存在,可直接证实流体注入触发)。相反,观测到的主震前-余震序列表明,沿分段断层系统的构造应力积累可能是主要的地震触发机制。
大多数集群性地震遵循扩散分布模式,表明这些地震是由孔隙压力扩散驱动的。在初始阶段,一些落在扩散曲线之前的异常地震很可能是由附近水力压裂作业引起的孔隙弹性效应触发的。近年来,野外观测、现场测量和数值模拟强调了无震滑移在诱发地震活动中的作用。尽管孔隙压力扩散和地震滑移的理论迁移模式有所不同,但由于构造非均匀性和地下应力条件未知,在野外观测中区分两者仍然具有挑战性。

图3 WSGF中重新定位地震的分布。(a)标有区域和震群(R1—R5)的地图,浅青色星号代表目录中四个ML﹥3的事件;(b)重新定位地震沿纬度的投影;(c)重新定位地震沿经度的投影;(d)不同深度的地震计数
2. 2019年Mw5.0地震的持久余震
2019年9月发生的Mw5.0地震是威远页岩气田迄今记录到的最大地震事件,多学科研究集中体现了该地震三个关键特征:①此次逆断层地震破裂了一条东北走向的断层,震源深度4.7 km,质心深度4.5 km;②破裂区域面积约11 km²,强烈的余震活动集中在其外围;③破裂断层表现出由注入后无震滑动驱动的11个月的前兆活动。
值得注意的是,在2022年8月至2023年2月的六个月监测活动中,研究人员在震源区内检测到了持续的地震活动。这些地震在空间上与余震位置重合,勾勒出断层面并包裹了椭圆形的破裂区域,表明它们具有持续性余震的性质。研究人员采用基于威远页岩气田宽层析成像的简化一维速度模型,从而提供了更广泛的区域代表性。与钻孔模型相比,该研究模型中浅层的P波和S波速度相对较高,这可能导致震源更深。持续的余震序列表明,Mw5.0地震后断层应力存在持续的不均匀性。这些观测结果强调了在诱发或触发地震活动区域进行长期地震监测的重要性。
相反,研究人员没有观测到2019年12月Mw4.9地震的余震。该地震是威远页岩气田中的第二大触发事件,发生在Mw5.0地震三个月后,且震源深度略浅。一个合理的解释是,Mw5.0地震残余应力的不均匀性维持了其余震活动,而Mw4.9地震缺乏这样的驱动条件。
来源:Yang L, Zi J, Wang R, et al. Monitoring induced seismicity in the weiyuan shale gas field utilizing a dense array. Tectonophysics, 2025: 230862.
基于机器学习的2009年拉奎拉地震序列的高分辨率数据集
近年来,机器学习(ML)技术已成为地震学研究中的一种有力工具,使得传统方法通常无法察觉的小震事件得以检测。来自意大利国家地球物理与火山学研究所(INGV)的科学家基于2009年拉奎拉地震序列的数据,应用基于机器学习的方法改进了对中亚平宁山脉(Central Apennines)正断层系统和余震活动的表征。通过处理来自永久和临时地震台站的数据,研究识别出了2009年1月至12月期间记录的约19.1万个地震事件,局部震级范围为−1.83—5.96级,几乎是INGV维护的标准目录的十倍。通过结合绝对定位和相对定位技术对这些事件进行重新定位,得到了包含148 000个地震事件的高分辨率目录。该目录的特点是增加了S波拾取数量,进而显著减少了定位误差,并提高了断层几何形状重建的精度。与现有的半自动地震目录相比,该研究发现机器学习方法使新事件的识别和定位得到显著改善,P波和S波到达识别的质量和数量也显著提升。改进后的地震目录不仅提供了更详细、更准确的断层结构定义,还提供了对余震分布的新见解,揭示了通常在标准分析中被掩盖的复杂断层模式。该研究凸显了机器学习方法在增进人们对复杂断层系统和地震序列理解方面的潜力。相关研究发表在2025年10月的Geophysical Journal International。
揭示地震序列和大地震激活的断层的几何形状是一个具有挑战性的问题,对这一问题的探讨有助于理解地震和变形过程的演变并约束预测程序。最近的观测表明,未知的交错正交断层网络的破裂是地壳大地震的一个特征,这增加了地震危险性评估的难度。通过应用机器学习算法,可以扫描密集的连续数据集并创建密集的地震目录,从而加强对大地震后地震过程如何直接向广阔区域扩展的观察。机器学习工具能够创建高分辨率地震目录,降低完整性级别,并扩大在大型和小型地震序列中所激活震源的定义。
2009年拉奎拉地震是一个值得关注的案例,因为它展现了弥散断层分段、高孔隙压力和复杂的继承性构造,从而解释了6.1级主震的成核过程以及地震序列的演化。研究人员将基于机器学习的工作流程应用于2009年拉奎拉地震序列,通过处理地震台网连续波形数据,利用深度神经网络PhaseNet自动拾取P波与S波到时,通过无监督算法GaMMA进行震相关联、事件定位与震级估算。随后,结合Hypoellipse(地震定位程序)进行绝对定位及HypoDD双差定位,生成地震事件的高分辨率目录。

图1 过去十六年,中亚平宁山脉发生了多起地震。图中点代表2009年拉奎拉地震和2016—2017年的地震目录,线代表发震断层
2013年,Valoroso等以2009年拉奎拉地震为例,通过半自动程序获得了高质量地震目录LV2013。该研究采用自动化方法,通过机器学习模块(即PhaseNet选择器和GaMMA关联器)产生的地震事件是LV2013目录的四倍。对这些不同地震目录(LV2013目录、含40多万个事件的未过滤地震目录、含超过19万个事件的过滤地震目录)的完整性震级(Mc)进行分析,结果显示机器学术使Mc逐渐降低。这些目录的频率-震级分布在ML1.5—1.7附近呈现出明显的斜率变化。这一特征导致其曲率偏离了古登堡-里克特定律预期的典型线性行为,表明其分布较为复杂。随后,研究采用绝对和相对方法对震源进行细化,生成了新的高分辨率地震目录,这有助于深入了解了地震活动的时空演变。
研究采用了一种新方法来计算海量地震数据集的相对位置。在已有高分辨率目录LV2013中,整个区域被划分为重叠率为70%的切片,每个切片内的地震在不同时间重新定位,并取平均结果。在这里,研究人员从191000个一维位置中随机提取约5000个地震,并对其进行1149次定位,从而为每个事件分别提供至少10个和最多56个位置。最终的目录是通过合并所有位置并平均同一事件的相对位置,将每个位置与簇质心的距离进行加权而生成的。这种新方法保留了双差分法的假设,因为当地震事件归因于同一震源时,可以使用该方法。

图2 (a)通过结合PhaseNet和GaMMA机器学习模块提取的408 000次地震事件的频率直方图;(b)对57 079个随机选择的地震事件进行GaMMA震级校准,使用正交范数计算回归,图中显示了角度系数(m)和截距(q)及其误差;(c)与之前研究相比,选定的191 000次地震事件的震级分布
研究发现,使用绝对和相对方法进行重新定位,可以提高震源精度。因为使用GaMMA后,震源精度明显降低。与LV2013目录的比较表明,常见地震事件的绝对一维位置具有相似的模式和空间分布。经过相对定位后,两个目录(LV2013目录、含超14万个地震事件的双差目录)的断层定位和清晰度均得到了显著提升。机器学习程序的性能很高,因为即使不使用互相关数据,断层结构的相似特征和细节也能显现出来。
基于机器学习的双差分定位目录证实了先前的研究结果,即余震强烈地分布在2009年主震破裂的主断层及其上盘和下盘的其他段上。在中部和北部,主平面上的聚集现象非常明显,分别激活了帕加尼卡(Paganica)断层和蒙蒂德拉拉加-戈尔扎诺(Monti della Laga-Gorzano)断层。在帕加尼卡断层的南部,地震活动范围扩大,并且在平面周围分布得更加稀疏,这与先前的研究结果一致。这些特征是真实存在的,并且对数据、数据不确定性和定位方法不敏感。

图3 MannekenPix和PhaseNet的P波拾取(上图)与S波拾取(下图)之间的差异
主震附近的强烈细化表明,该研究能够非常精细地定义和描绘数十至百米尺度的断层几何形状及其非均匀性。断层倾角从10–5 km深度处的尖锐平面变为上方更加叠覆的结构,不同的小平面以不同的角度从主平面分支出来。这种变化可合理地归因于与带内先存结构的相互作用。较小的双差分重定位误差表明,该目录能够提高序列中激活的断层面几何形状的分辨率,并证实事件的相对位置是真实的,而非由重定位伪影造成。
此外,同震破裂传播的主段与10—5 km深度处的余震排列一致,而其向上破裂可合理地归因于先存结构的变化。另一个关键区域是2009年和2016年都发生地震的拉奎拉北部地区。为了重点分析断层几何形状,研究人员将新目录与2016—2017年序列的目录叠加,因为这两个序列的相对位置相似。在两个地震序列中,蒙蒂德拉拉加-戈尔扎诺正断层系统均被激活,震级均为5级以上。但是,断层的激活部位不同。2009年的地震集中在5—10 km深度,而在2016年的序列中,地震传播到较浅(5—10 km)和较深(10—15 km)的深度。后一种地震活动在特定段上的分布不太一致,而是沿着断层系统和断层上盘扩散,表明2016年主破裂后,应力发生了广泛的重新分布。

图4 (a)使用HypoDD重新定位的148 000次地震事件(蓝点)的分布;(b)垂直剖面显示发生在该剖面±0.5 km范围内的余震的深度分布
总体而言,研究建立了一种新的2009年拉奎拉地震序列的高分辨率地震目录,该目录是通过将机器学习模块与渐进的绝对和相对定位方法相结合而获得的。通过逐步改进定位,研究人员获得了一个包含约148 000个高分辨率双差位置的最终目录,提高了之前使用手动或半自动程序所得数据集的分辨率。位置明确的地震大幅增强了对断层系统结构的观察,从而可以更好地定义地震活动的时空演变。研究观察到,沿着40 km长的断层系统,余震在西南倾断层面上的聚集是2009年序列的显著特征。这种聚集现象在断层的南端消失,逐渐减弱为断层上盘的弥散分布。北部的蒙蒂德拉拉加-戈尔扎诺断层也呈现出明显的地震聚集性,而在2016—2017年序列中,该断层呈现出明显的地震扩散分布。这种聚集性的变化与数据或方法无关,而与地震过程的物理机制有关。研究认为,在2009年6.1级地震和2016年6.5级主震之后,断层系统发生了不同的应力重分布。
来源:Fonzetti R, Govoni A, De Gori P, et al. Machine learning-based high-resolution data set for the 2009 L'Aquila earthquake sequence. Geophysical Journal International, 2025, 243(1): ggaf286.
通过并行符号枚举发现物理规律
符号回归能够从数据中发现简洁、可解释的数学表达式,在现代科学研究中发挥着关键作用。其核心挑战在于:如何在无限搜索空间中寻找既简洁又具普适性的数学公式,同时力求拟合训练数据。过去十年间,已有符号回归算法在处理复杂问题时始终面临准确性与效率的双重瓶颈,这严重制约了符号回归在跨学科科学探索中的应用。为此,研究人员创新性地提出并行符号枚举(PSE)技术,以从有限数据中高效提炼通用数学表达式。实验表明,与最先进的基线算法相比,PSE在超过200个合成和实验问题集上实现了更高的准确率和更快的计算速度(例如,将恢复准确率提高了99%,将运行时间缩短了一个数量级)。PSE标志着数据驱动下准确高效发现符号化可解释模型(如潜在的物理规律)的重大突破,显著提升了符号学习的可扩展性。相关研究发表在2025年11月的Nature Computational Science。
几个世纪以来,科学发现越来越多地受到数据的驱动。符号回归(Symbolic Regression,SR)作为这一领域的先锋技术,致力于从观测数据中自动发现可解释的数学表达式,而无需预设特定函数形式。这种能力推动了多个领域的科学进步,如天体建模、物理规律发现等。符号回归的核心挑战源于可能表达式的组合爆炸式增长,导致穷举搜索变得不可行。
符号回归需要评估由多种算子、变量和常量构成的大量复杂符号表达式。现有的所有符号回归方法都对每个候选表达式进行独立评估,导致计算效率极低。如果能提升候选表达式的评估效率,就能设计出更少依赖特定优化方法的新型符号回归算法,同时提高在广阔搜索空间中直接找到全局最优解的概率。
为此,研究人员提出并行符号枚举(Parallel Symbolic Enumeration,PSE)方法,以从有限数据中自动发现符号表达式。PSE可高效评估潜在表达式,从而在短短几秒内并行探索数亿候选表达式。并行符号回归网络(Parallel Symbolic Regression Network,PSRN)是PSE的核心,作为核心搜索引擎,PSRN有两大特点:①自动捕获不同数学表达式树的公共子树,以进行共享评估,避免冗余计算;②利用图形处理单元(GPU)进行并行搜索,显著提升搜索性能。为了探索复杂的表达式,PSRN被集成到一个带有标记生成器(例如遗传编程)的迭代循环中。

图1 PSE模型概览
为了证明PSE模型的有效性和效率,研究人员在一系列具有挑战性的任务中对其进行了全面评估,包括标准的符号回归基准测试、混沌动力学系统控制方程的数据驱动发现,以及从实验数据中对真实物理现象的建模。
1. 符号回归基准测试
基准问题集通常被用于评估符号回归算法的性能,研究人员通过多个基准问题集(包括Nguyen、Nguyen-c、R、Livermore、Feynman等)验证了PSE在恢复指定数学公式时的有效性。同时,将PSE的性能与八种基线方法进行了比较,例如符号物理学习器(SPL)、神经引导遗传编程(NGGP)、深度生成符号回归(DGSR)、Python符号回归(PySR)、贝叶斯机器科学家(BMS)、统一框架下的深度符号回归(uDSR)、基于transformer规划的符号回归(TPSR)等。
以符号恢复率和计算时间为评估指标的分析表明,PSE方法在所有基准问题集中的恢复率都优于基线方法,同时保持了高效率(消耗的计算时间最少),实现了高达两个数量级的速度提升。

图2 不同模型在符号回归基准测试中的性能,以符号恢复率(左)和运行时间(右)两个指标进行评估
2. 混沌动力学系统控制方程的发现
非线性动力学在自然界中普遍存在,其通常由一组微分方程支配。从有限的观测数据中提炼这些控制方程,对于深入理解非线性动力学的基本机制至关重要。为此,研究人员测试了PSE模型发现多维自主混沌动力学系统的控制方程的能力。
该测试的目标在于验证符号回归方法能否在有限的计算时间内(例如几分钟),在给定一组算子时,成功恢复潜在微分方程。结果表明,在四种不同水平的高斯噪声条件下,相较于NGGP、DGSR、BMS等方法,PSE可以实现更高的符号恢复率,能够更准确地识别潜在的控制方程(即使在噪声影响下),从而更好地描述混沌行为。

图3 不同模型对非线性混沌动力学方程的数据驱动发现情况
3. 机电定位系统和湍流摩擦的控制方程发现
真实世界的数据充满了复杂的噪声和非线性,可能会影响符号回归算法的有效性。为了进一步验证PSE模型在揭示真实世界动力系统(例如机械装置)控制方程方面的能力,研究人员在机电定位系统(EMPS)的一组实验数据上测试了其性能。EMPS是机器人或机床中棱柱关节的驱动系统的标准配置,找到此类系统的控制方程对于设计更好的控制器和优化系统参数至关重要。与八个关键基准模型(PySR、NGGP、DGSR等)的对比分析表明,PSE在成功发现潜在控制方程方面表现最佳。该模型既能准确揭示正确的控制方程,又能保持较低的预测误差。
在流体力学领域,基于实验数据找到统一公式,以定量关联雷诺数(反映流动流体中惯性力与粘性力之间的平衡,是决定流动状态的关键参数)、相对粗糙度和摩擦因子,是该领域的一个基本挑战。基于真实实验数据,研究测试了PSE等模型对流体动力与摩擦阻力关系背后规律的揭示能力。结果表明,尽管多种方法达到了相当的均方误差(MSE)表现,但PSE模型在拟合准确性与表达式简洁性之间取得了最佳平衡。PSE不仅与其它方法的拟合性能相当或更优,还生成了更简洁的符号表达式。

图4 通过机电定位系统的实验数据发现物理规律
4. 高维空间中的可扩展性
为深入评估PSE的扩展性及其隐式特征选择能力,研究设计了一个具有挑战性的高维合成基准测试。该基准包含20个问题,其真实方程被嵌入到50维输入空间中(每个方程包含12个有效变量,其余38个变量充当干扰项)。测试结果表明,在高维且存在噪声的环境中,PSE展现出显著的鲁棒性,成功恢复了40%的真实表达式。相比之下,在相同计算时间预算内,PySR等主流基线方法未能识别出任何正确解(恢复率为0%)。
5. 讨论
PSE通过将范式从候选表达式的独立、顺序评估转变为并行化、共享式计算框架,直接解决了符号回归中长期存在的效率-准确性瓶颈。PSE识别并利用常见子树的能力使得大规模并行枚举成为可能,从而为解决更复杂、更高维的发现问题开辟了新途径。当与标记生成器(如遗传编程、蒙特卡洛树搜索)结合使用时,PSE深入解析复杂表达式的能力进一步增强,展现出加速科学领域数据驱动发现的潜力。
尽管性能出色,PSE未来仍面临几个需要解决的挑战。主要挑战之一是随着符号层数量的增加,PSRN模块对内存的需求迅速增长。此外,当前处理常量的两阶段方法(对标记常量进行抽样,然后通过最小二乘法精炼),虽然有效但并非没有局限性。如果真实系数远超初始抽样范围,最小二乘法可能无法找到全局最优解。
进一步来看,与所有数据驱动的方法一样,PSE的性能与数据的质量和性质有着内在的联系。当噪声水平较高时,其性能会下降,导致过拟合。从实际应用限制来看,虽然该方法可在多种计算平台上运行,但其加速效果在支持大规模并行处理的硬件上表现最佳。与大多数符号回归方法类似,PSE也受限于预定义的离散算子集,若不进行扩展,将无法发现新的数学形式。
来源:Ruan K, Xu Y, Gao Z F, et al. Discovering physical laws with parallel symbolic enumeration. Nature Computational Science, 2025: 1-14.
主送:中国地震局领导
编发:中国地震局地震预测研究所





