2023-04-22
由于高頻地震波受傳播路徑影響大,固定臺(tái)網(wǎng)記錄的低震級地震(M<3.0)的震源參數(shù)求解仍然困難,因此地震事件分類方法一般是從地震記錄中提取識別特征。單一特征的缺陷是分類能力的穩(wěn)定性及普適性較差,因而多特征綜合的人工智能方法在地震分類中得到了廣泛的應(yīng)用。近些年提出的極限梯度提升算法(Extreme Gradient Boosting, XGBoost)算法,是一種設(shè)計(jì)效率高、適用性強(qiáng)的新型提升決策樹算法,已應(yīng)用于不同領(lǐng)域,但在地震學(xué)研究中的應(yīng)用較少,值得進(jìn)一步探索。
中國地震局地球物理研究所王婷婷助理研究員針對地震、爆炸與礦震的分類問題,基于時(shí)頻域地震記錄,量化提取了幅值比、高低頻能量比、拐角頻率、持續(xù)時(shí)間、復(fù)雜度、過零率、倒譜復(fù)雜度、瞬時(shí)頻率復(fù)雜度等8類36個(gè)特征,建立了特征提取數(shù)據(jù)集(圖1);作為對比,利用多窗口譜分析對地震記錄建立了201維波形譜數(shù)據(jù)集;利用XGBoost方法分別構(gòu)建了地震/爆炸、地震/礦震、爆炸/礦震的兩分類與三分類模型(圖2),通過混淆矩陣、ROC等指標(biāo)對比了基于特征提取數(shù)據(jù)集和波形譜數(shù)據(jù)集的分類能力;利用研究區(qū)域內(nèi)和研究區(qū)域外數(shù)據(jù)進(jìn)行了模型的泛化能力測試,并與SVM方法進(jìn)行對比。本文得到特征提取方法可以突出不同類型地震事件之間的差異;分類模型的準(zhǔn)確率均高于90%,其中地震與礦震、地震與爆炸分類準(zhǔn)確率高于95%;泛化能力測試表明,基于特征提取數(shù)據(jù)集構(gòu)建的分類模型對不同區(qū)域事件的泛化能力強(qiáng);XGBoost構(gòu)建的分類模型的不同性能指標(biāo)均高于SVM,表明XGBoost在地震事件分類中有較好的應(yīng)用前景。
圖1 特征分布圖,P/S幅值比(a);S拐角頻率(b);高低頻能量比(c);持續(xù)時(shí)間(d)
圖2 地震/爆炸(a)、地震/礦震(b)、爆炸/礦震(c)、三分類(d)模型分類準(zhǔn)確率
本研究的創(chuàng)新點(diǎn)包括:
1. 特征提取數(shù)據(jù)集與波形譜數(shù)據(jù)集,基于天然地震、人工爆炸、礦震三類地震記錄的時(shí)頻特征差異,量化提取了最大振幅比、高低頻能量比、譜比、拐角頻率、持續(xù)時(shí)間等判據(jù),建立了36維特征提取數(shù)據(jù)集;作為模型泛化能力對比,同時(shí)基于多窗口譜分析建立了201維波形譜數(shù)據(jù)集。
2. XGBoost構(gòu)建分類模型,XGBoost是Chen and Guestrin提出的新型提升決策樹算法,增加了正則化項(xiàng)防止過擬合,支持并行計(jì)算,已應(yīng)用于不同領(lǐng)域。本文在地震分類中引入了XGBoost方法,并與應(yīng)用廣泛的SVM方法進(jìn)行了對比。
本文構(gòu)建的地震、爆炸、礦震的兩分類與三分類模型可直接應(yīng)用于區(qū)域地震記錄中的非天然地震分類與編目中,研究方法也可應(yīng)用于礦區(qū)微震分類。一方面建立準(zhǔn)確的天然地震目錄有利于進(jìn)行活斷層劃分、強(qiáng)震預(yù)測、地震危險(xiǎn)性評估等地震學(xué)研究,另一方面,確定完整的爆炸、礦震等非天然地震目錄有助于評估突發(fā)爆炸災(zāi)害以及采礦誘發(fā)地震的風(fēng)險(xiǎn)性。研究成果2022年發(fā)表于學(xué)術(shù)期刊《Computers and Geosciences》(Wang Tingting, Bian Yinju, Zhang Yixiao, et al., Classification of earthquakes, explosions and mining-induced earthquakes based on XGBoost algorithm. Computers and Geosciences, 2022,170,105242)。
【作者介紹】
王婷婷,非天然地震研究室,助研,主要從事特殊事件監(jiān)測、爆炸當(dāng)量估算、天然地震與非天然地震事件分類識別等研究。