北京师范大学地表过程与资源生态国家重点实验室
  中文|English  
 
您的位置: 首页» 实验室新闻» 学科动态» 地表过程
许冲等定量比较了不同机器学习模型在构建地震滑坡易感性图中的表现-Computers & Geosciences
发布时间: 2012-06-14  

【研究概况】

原中国地震局地质研究所许冲团队(现在应急管理部国家自然灾害防治研究院工作)比较了以下六种基于GIS的地震诱发滑坡易感性制图模型:二元统计(BS)、逻辑回归(LR)、人工神经网络(ANN),以及使用三种不同核函数的支持向量机(SVM)模型:线性、多项式和径向基。该模型应用于涪江的一个支流流域,涪江是嘉陵江的一条支流,位于2008年5月12日川地震的受灾地区。

该研究使用了11个主题数据层:滑坡清单、坡度、坡向、高程、曲率、与排水系统的距离、地形湿度指数(TWI)、与主要道路的距离、与地表破裂的距离、峰值地面加速度(PGA)和岩性。使用六个模型生成敏感性图。通过分别代表成功率和预测率的两个曲线下面积(AUC)对所得敏感性图进行了验证和比较。6个结果的AUC值表明,LR模型的成功率最高(AUC=80.34),预测率最高(AUC=80.27)。SVM (径向基)模型的成功率(AUC=80.302)和预测率(AUC=80.151)均接近LR模型。使用SVM(线性)模型的结果AUC值最低。SVM(线性)模型的AUC值仅为72.52(成功率)和72.533(预测率)。此外,研究结果还表明,径向基函数是三种核函数中最适合用于研究区地震诱发滑坡易感性制图的核函数。该研究挑战了人们普遍认为的软计算技术模型在所有研究区域的验证性能都高于LR、BA的观点。

【研究区背景】

研究区位于龙门山山脉,地处中国四川省平武县涪江(嘉陵江的一条支流)的支流流域。研究区海拔687.89 m ~ 3047.78 m,面积约173.184 km2。研究区坡度普遍较陡,最大坡度角为72.81°,平均坡度角为30.81°。2008年5月12日14时28分(北京时间),研究区发生里氏8.0级地震,造成巨大的生命财产损失。

汶川8.0级地震发生在龙门山山脉,该地区由于印度板块和欧亚板块的碰撞而正在变形。印度板块一直在向北移动,导致青藏高原隆起。川地震在青藏高原东缘龙门山断裂带上断裂了两条大型逆冲断层,一条是沿北川断裂的240 km地表破裂带,另一条是沿灌断裂的72 km地表破裂带。此外,北川断裂与灌断裂之间还存在一条长约7 km的北西向左向逆断裂。

【数据与研究方法】

1.滑坡清单与空间分布分析

研究区域在2008年5月12日的地震中经历了一次剧烈的震动。这次地震引发了大面积的山体滑坡。滑坡易感性制图统计模型(如BS、LR、ANN和SVM)的一个关键特征是,滑坡发生的可能性与震后航空照片和多源遥感图像解译的汶川地震引发的滑坡吻合,并通过实地检查进行验证。这一大面积滑坡分布区形成了了一个更为集中的NE-SW延伸滑坡带,与北川-映秀活动断裂带相吻合。

滑坡清单图显示了可识别的滑坡的位置和边界。在研究区,共圈定了汶川地震引发的滑坡944个。并且在航拍上大致圈定了滑坡的源区和堆积区。因此,将每个滑坡绘制为两个多边形,一个代表源区,另一个代表堆积区。944个滑坡源区总面积为6.329 km2,堆积区面积为7.323 km2。

2.滑坡易感性制图模型

1)二元统计(BS)

对于BS模型,将每个因素与滑坡清单图进行比较。用于对每个影响因子进行分类的类别的加权值是根据每个类别中的滑坡数量密度确定的。该模型需要对因子进行选择和作图,并将其划分为若干相关的类别,进行滑坡清单图的作图,将滑坡清单图与各因子图叠加作图,确定各因子类中的滑坡数量密度并确定加权值,对各因子图分配加权值,最终叠加作图并计算研究区各单元的最终易感性指数值。

2)逻辑回归(LR)

LR模型在一组自变量上回归一个二分类因变量,这些自变量可以包含连续变量和分类变量。使用最大似然模型检验了预测变量与滑坡存在与否之间的关联。回归的结果可以解释为因变量的一种状态的概率,因为它们被限制在0和1之间的区间内。

3)人工神经网络(ANN)

神经网络可以直接替代自相关、多变量回归、线性回归、三角函数等统计分析和技术。人工神经网络具有处理不精确和模糊数据的能力,它们可以在不违反任何假设的情况下处理连续、分类和二进制数据。由于滑坡发生概率的评估是通过从过去滑坡的经验中预测未来事件来进行的,因此可以认为这是人工神经网络模型的理想应用。

4)支持向量机(SVM)

SVM 是最近开发的模型,它基于将协变量非线性转换为更高维的特征空间。对于判别型问题,SVM可以使用核函数将原始的非线性数据模式转换为在高维特征空间中线性可分的格式。

3.影响因子的选择

基于研究区的地震、地形、地质、环境影响因素,选取了坡度、坡向、高程、曲率、与排水系统的距离、地形湿度指数(TWI)、与主要道路的距离、与地表破裂的距离、峰值地面加速度(PGA)和岩性十个影响因子。

【研究结果】

1.滑坡易感性图

运用各个模型得到的滑坡易感性图如下图所示


不同模型的滑坡易感性图(A) BS模型;(B) LR模型;(C)人工神经网络模型;(D)线性函数支持向量机模型;(E)多项式函数支持向量机模型;(F)径向基函数支持向量机模型

2.模型应用结果的验证

利用滑坡训练数据集和验证数据集对滑坡敏感性建模结果进行验证,生成相应的成功率和预测率。利用川地震引发的滑坡在研究区内的分布情况,对绘制的滑坡易感性图的有效性进行了评价。通过将已知滑坡的空间分布与易感度图中滑坡类别的空间分布进行比较,验证了该方法的有效性。构建成功率和预测率曲线,并计算其曲线下的面积(AUC),以进行比较。

为了定量比较结果,重新计算曲线下的面积,使总面积等于100。从6个易感性图获得的AUC值显示,LR模型的成功率最高(AUC=80.34),预测率最佳(AUC=80.27)。SVM (径向基)模型的成功率(AUC=80.302)和预测率(AUC=80.151)均接近LR模型。使用SVM(线性)模型的结果显示AUC值最低。SVM(线性)模型的AUC值仅为72.52(成功率)和72.533(预测率)。最后的结果表明,径向基函数是该研究中使用SVM模型测试的三个核函数中最令人满意的核函数。



曲线下面积(AUC)表示所使用模型的成功率和预测率。(a)成功率曲线和(b)预测率曲线

【讨论与研究结论】

近年来,基于GIS技术的滑坡易感性制图出现了不同的模型。基于2008年川地震引发的嘉陵江支流涪江流域滑坡清单数据,应用BS、LR、ANN和SVM构建了滑坡易感性图。结果清楚地表明,LR模型获得的易感性图比其他模型具有更好的精度,排第二的是径向基函数的SVM模型。结果表明,人工神经网络模型与三种支持向量机模型的准确率比较接近。该研究挑战了广泛持有的观念,即通过软计算技术获得的模型的验证性能在所有研究区域都高于LR, BA。该文给出了一个反例,表明模型受到其他因素的影响,如局部因素、训练数据等。

该研究提供了一种有效的灾害管理和减灾方法,并为规划人员和工程师选择合适的地点实施重建和发展提供了建议。

该文章发表在期刊 Computers & Geosciences 上,内容详见:XU C, XU X, DAI F, et al. 2012. Comparison of different models for susceptibility mapping of earthquake triggered landslides related with the 2008 Wenchuan earthquake in China. Computers & Geosciences [J], 46: 317-329.

原文链接:https://doi.org/10.1016/j.cageo.2012.01.002


浏览次数: