非地质灾害样本的合理选取对地质灾害易发性预测准确度的提高具有重要意义。文章以柳林县为例,选取适宜的影响因子,基于GIS技术采用随机森林模型进行易发性评价。以地质灾害与非地质灾害比例为1∶1、1∶1.5、1∶3、1∶5、1∶10和非地质灾害点距已知灾害点100,500,800,1000 m为选取条件交叉结合共创建20组模型进行分析。结果表明:(1)通过误差指标、混淆矩阵和ROC曲线检验,样本比例和距已知灾害点距离变化对地质灾害易发性评价结果有较大影响。随着样本比例变小,距已知灾害点距离增加,各模型平均绝对误差和均方根误差整体下降,准确率整体上升。各模型ROC曲线下面积值均大于0.8,均有较好的预测效果。当样本比例小于1∶3时,距已知灾害点距离增加对模型误差和准确率影响较小,变化趋于稳定。综合判断样本比例为1∶10、距已知灾害点1000 m为最适合研究区模型。(2)高和极高易发区主要分布在中部及北部道路和河流两侧的地区,是柳林县防灾减灾的重点区。(3)样本选取差异导致易发性结果不同主要是因为建模过程中随机森林模型对数据特征的采集及判断发生变化,样本是否具有代表性发生变化。这些研究成果对当防灾减灾工作的实施具有重要意义。
非地质灾害样本的合理选取对地质灾害易发性预测准确度的提高具有重要意义。文章以柳林县为例,选取适宜的影响因子,基于GIS技术采用随机森林模型进行易发性评价。以地质灾害与非地质灾害比例为1∶1、1∶1.5、1∶3、1∶5、1∶10和非地质灾害点距已知灾害点100,500,800,1000 m为选取条件交叉结合共创建20组模型进行分析。结果表明:(1)通过误差指标、混淆矩阵和ROC曲线检验,样本比例和距已知灾害点距离变化对地质灾害易发性评价结果有较大影响。随着样本比例变小,距已知灾害点距离增加,各模型平均绝对误差和均方根误差整体下降,准确率整体上升。各模型ROC曲线下面积值均大于0.8,均有较好的预测效果。当样本比例小于1∶3时,距已知灾害点距离增加对模型误差和准确率影响较小,变化趋于稳定。综合判断样本比例为1∶10、距已知灾害点1000 m为最适合研究区模型。(2)高和极高易发区主要分布在中部及北部道路和河流两侧的地区,是柳林县防灾减灾的重点区。(3)样本选取差异导致易发性结果不同主要是因为建模过程中随机森林模型对数据特征的采集及判断发生变化,样本是否具有代表性发生变化。这些研究成果对当防灾减灾工作的实施具有重要意义。