基于机载高光谱和LiDAR数据的树种分类

来源: 未知 作者:paper 发布时间: 2020-05-17 15:16
论文地区:中国 论文语言:中文 论文类型:工程硕士
树种的识别是森林资源监测中最为基础和关键的指标之一,在实际森林资源调查 中具有重要意义。本文综合考虑机载高光谱影像和LiDAR数据在数据结构和特征中 表现出来的优点和特点
摘要
树种的识别是森林资源监测中最为基础和关键的指标之一,在实际森林资源调查 中具有重要意义。本文综合考虑机载高光谱影像和LiDAR数据在数据结构和特征中 表现出来的优点和特点,将两者相结合应用在树种分类方面,评估两种数据源在复杂 森林类型中进行树种精细识别的能力O
选择广西高峰林场界牌分场树种种类丰富的区域作为研究区,结合机载高光谱影 像与同步获取的LiDAR数据进行树种分类。首先对影像进行多尺度分割,利用 ESP(Estimation of Scale Parameter)尺度评价工具获取最优分割尺度,结合地物实际特 征,确定多层次最优分割参数。然后对机载高光谱数据和LiDAR数据进行特征提取, 从机载高光谱影像中提取ICA(Independent component analysis)变换特征、植被指数, 并分析树种的光谱特征构建新的指数,采用灰度共生矩阵方法提取纹理特征,同时从 LiDAR数据中提取冠层高度模型CHM(Canopy height model)作为高度信息,构建多特 征集合。利用面向对象和分层分类相结合的方法,在最优分割尺度下进行分层分类, 区分非林地、其他林地和有林地。对有林地进行树种的精细分类,利用不同特征组合 结合K邻近法、支持向量机和决策树三种分类器对研究区树种进行分类并做精度评 价,比较不同特征组合和分类器对树种分类精度的影响。
结果表明,多层次分割可以更好的区分不同地物边界,分割效果最符合实际地物 轮廓,可在一定程度上提高分类精度。采用面向对象与分层分类相结合的方法,能够 有效避免“椒盐”现象以及各树种与其他地物的混分现象。三种分类器中,支持向量 机分类器分类效果最好,树种分类精度最高为94.20%, Kappa系数为09307。利用 随机森林消除冗余特征,能够进一步提升分类器的性能和效率,同时在筛选的特征子 集中,新构建的斜率光谱指数Sb作为优选特征,对提高树种分类精度具有一定作用。 纹理信息和高度信息对提升树种分类精度作用较大,能够有效的区分具有相似光谱特 征的树种,减少了 “异物同谱,同物异谱"的干扰。因此应用多维特征,可以有效改 善树种分类精度。结合两种数据源的分类方法对于南方复杂森林类型的树种精细识别 是有效的,满足树种分类的精度需求。

1.1.研究背景与意义
森林作为一种可再生资源,对人类文明的生存和发展发挥着重要作用。森林植被 类型的正确识别为森林资源的保护提供了依据和基础(刘旭升等,2004),同时,森林 地上碳储量估算的准确性也与树种识别的准确性密切相关(Liu et al., 2017)o传统的 树种识别方法需要依靠人力进行野外调查,所获得的信息往往不够全面,同时耗费的 成本也比较高。目前,中低分辨率遥感影像及多光谱影像在植被识别方面应用较广泛, 但由于数据具有较低的空间分辨率和光谱分辨率,只能达到森林类型的识别,对于树 种级别的分类较难区分(Connette et al., 2016; Zhu et al., 2014)。
如今,高光谱遥感逐渐发展起来,高光谱数据的光谱分辨率很高,所含的光谱信 息近似连续,因此对于地物的识别精度大大提升。与普通的多光谱数据相比,高光谱 影像将光谱信息和空间信息相结合,所获得的数据包含了更为丰富的信息,抑制了其 它因素在光谱空间上的干扰,可以准确地识别出各地物类型细微的光谱差异。在树种 识别方面,增加了森林树种的可分性,提高了识别精度。目前,利用高光谱数据进行 树种识别分类已成为一个研究热点,越来越多的研究者致力于树种精准识别方法研究 (樊雪等,2017;于丽柯等,2016;张丽云,2016)。
由于高光谱影像只能体现水平方向的信息,如光谱信息、纹理信息等,因此难以 避免“异物同谱、同物异谱”的现象产生。即使是利用空间分辨率较高的光谱遥感影像, 也很难做到树种级别的精细分类。而空间垂直结构信息作为一个重要的补充特征,有 可能在更精细的尺度上对树种进行分类。机载LiDAR数据能够很好的探测林分的垂 直结构信息,对森林结构特性以及冠层理化特征的提取均具有明显优势,同时也有助 于森林类型的识别(Heinzel et al., 2011;Hollaus et al., 2006)。由于机载 LiDAR 数据 获取垂直结构信息的能力较强,但在水平方向上无法获得相关信息(庞勇等,2005), 仅依据树高等垂直信息,很难准确确定树种的类型。因此,在树种识别上,可以将机 载LiDAR数据与高光谱数据结合,发挥LiDAR数据垂直结构特性的优势。
综合考虑两种数据源的数据结构,分析其各自表现出来的优点和特点,将高光谱 影像与LiDAR数据相结合,实现优势互补,在地物识别与分类方面得到了很好的应 用。相关的研究主要关注林分结构单一的树种识别,对复杂森林类型进行树种精细识 别的能力尚不明确,尤其是在中国南方亚热带季风气候区的林区。因此本研究结合机 载高光谱数据与同步获取的LiDAR数据,利用不同特征组合以及多种分类器进行面 向对象的树种分类,评估两种数据源在中国南方亚热带季风气候区对于复杂森林类型 树种精细识别的能力,比较分析不同特征变量组合对树种分类效果的差异和贡献,为 今后高效精细的提取森林树种信息提供思路。
12国内外研究现状
1.2. 1.高光谱遥感分类研究现状
由于空间和光谱分辨率的限制,利用中低分辨率及宽谱段影像仅能实现森林类型 的识别。高光谱数据具有数据量大、波段多以及精细的光谱信息等特点,使树种识别 精度从源数据上得到一定的改善(陶江珥等,2018)o目前高光谱数据在森林植被识别 上的能力正在不断增强,国内外已有很多学者进行了相关研究。
Ghiyamat等利用高光谱数据对不同年龄树种进行分类,结合光谱反射率、一阶 导数光谱和二阶导数光谱,最终实现了六种不同年龄松树树种的分类(Ghiyamat etal., 2013)o Dalponte等利用高光谱数据进行北方森林树种的分类,采用三种分类器(支 持向量机、随机森林和最大似然法)实现了4种树种的分类,证明了高光谱数据对北 方森林树种的分类是有效的(Dalponte et al., 2013)。Fagan等使用高光谱数据和多时 相的Landsat影像对哥斯达黎加东北部的人工林树种进行分类。结果表明,使用高光 谱数据对6种树种进行分类的生产者精度为75%〜93%,加入时相信息后提高了树种 的分类精度(Fagan et al„ 2015)。Richter等利用机载高光谱数据对10种阔叶树种进行 分类,采用了偏最小二乘判别分析法(PLS・DA)进行分类,并与随机森林和支持向 量机方法比较,结果表明,运用此方法分类结果优于其它两种分类器(Richter et al., 2016)oMaschler等利用空间分别率为0.4米的机载高光谱数据对奥地利温带森林进行 树种分类,预测变量包括光谱反射率、植被指数、纹理特征等,利用面向对象方法结 合随机森林分类器进行分类,最终得到了较高的分类精度,总体分类精度达到 91.7%(Maschler et al„ 2018)。
国内学者在高光谱植被分类方面也已有很多研究。褚西鹏釆集了叶片的非成像高 光谱数据,对高光谱数据进行降维和波段选择,提出回归残差绝对均值方法,结果表 明此方法能够实现较优的波段选择的目的,并提高了树种分类的精度(褚西鹏,20⑵。 陈芳利用环境一号卫星的高光谱数据和CCD数据,进行植被信息的提取,对高光谱 波段选择方法进行了改进,最终提高了植被分类的精度(陈芳,2015)。荚文等以AISA Eagle II机载高光谱数据为基础数据,对山区森林类型及树种进行分类,实验结果表 明,研究区森林类型分类精度较高为97.74%,树种分类精度为92.11% (荚文等,20⑸。 于丽柯等以大兴安岭地区塔河林区为研究区,采用波谱角填图法和线性波谱分离两种 方法对HIS高光谱影像进行树种分类,结果表明,线性波谱分离方法效果较好,总体 精度达到72.0% (于丽柯等,2016) o张丽云利用Hyperion高光谱影像和实测的光谱数 据,以山东省泰安市徂裸山林场作为研究区,利用改进的波谱角分类方法,使得树种 分类精度提高了近5%, kappa系数提高近0.07(张丽云,2016) 0樊雪等利用机载PHI 高光谱数据进行去噪和降维,并结合分层分类的方法进行森林类别优势树种的识别, 结果表明PHI高光谱数据能够有效的区分树种组单一、林相整齐的森林树种(樊雪等, 2017)o汪少华等利用Hypersion高光谱数据对树种进行分类,提出了基于判别局部 片排列的流形学习算法(DLA)的降维方法,结果表明该方法使树种的分类精度得到有 效提高(汪少华等,2018) o
在利用光谱信息的同时,也有一些学者将影像的空间信息作为辅助信息来提高分 类精度(Fauveletal., 2013)。Dian等利用机载高光谱影像进行森林树种分类,证明结 合空间和光谱信息可以提高树种分类的准确性(Dianet al., 2015)。张倩倩对Hyperion 高光谱数据进行预处理,并结合纹理信息进行分类,结果证明应用多种特征组合能够 有效提高精细植被类型的分类精度(张倩倩,2013) o孙艳丽运用形态学的空谱特征提 取方法,对高光谱数据进行空间特征的提取,研究结果表明通过形态学轮廓特征的提 取,降低广同物异普'与“异物同谱廿对分类的影响,大大提高了分类的精度(孙艳丽, 2017)o
1.2. 2.面向对象的遥感影像分类
遥感影像的空间分辨率不断提高,利用传统的基于像元的分类方法会出现严重的 “椒盐效应",影响最终分类精度(Kaszta et乩,2016)。因此,对于高空间分辨率影像 的分类,基于像元的分类方法适用性较差。针对高分辨率遥感影像特性,Baatz与 Schape提出了面向对象的分类方法(Baatz et al., 2000),该方法是利用区域合并的分 割方法构建目标对象,使对象内部达到最小异质性,并对目标对象进行分类,能够有 效的避免“椒盐效应'‘的产生。
目前,面向对象的方法在植被分类方面已有较多研究。Immitzer等利用高空间分 辨率的WorldView-2卫星数据进行随机森林树种分类,研究采用了基于像元和面向对 象两种方法进行对比,结果显示,利用面向对象的方法对10个树种进行分类的总体 精度为82%,精度高于基于像元的分类方法(Immitzer et al., 2012)。Sasaki等利用机 载LiDAR数据和高空间分辨率遥感影像进行土地覆盖类型和树种的面向对象分类, 结果显示,在土地覆盖类型的分类中,采面向对象的方法,总体精度达到97.5%,在 树种分类中,总体分类精度也得到一定提高(Sasaki et al., 2012)。Li等以WorldView-2 和WorldView-3影像为基础数据,利用支持向量机和随机森林分类器,釆用面向对象 的方法完成了五种城市树种的分类(Lietal., 2015)。王志伟等结合决策树法和面向对 象的方法在玉树地区开展植被分类研究,克服了分类中的“椒盐效应”(王志伟等, 2013) o唐天琦利用GeoEye - 1的高分辨率遥感影像数据,对朝鲜某地区进行植被分 类的研究,采用面向对象的分类方法,最终分类精度达到90.14%, kappa系数为 0.8514(唐天琦,2015) o白金婷利用WorldView-2影像对福建省将乐林场进行森林类 型识别,运用单时相面向对象和两时相面向对象的多层次分类方法进行森林分类研究, 结果表明相比于基于像元的随机森林分类,面向对象的多层次分类和单层次决策树分 类的分类精度都得到了较大的提高(白金婷,2016)o郝浓等对西藏自治区林芝县进行 森林地物识别,对Landsat-8影像采用CART决策树的面向对象分类,总体分类精度 最高为82.53%, Kappa系数为0.768(郝浓等,2017)。张华等以GF・1遥感影像为数 据源,利用面向对象分类方法进行逐级分层分类,结果显示,面向对象的分类精度达 到83.02%,基于象元的分类精度为69.37%,表明面向对象的分类方法比基于象元的 分类方法更具优势(张华等,2017)。杨盼盼将纹理特征结合面向对象方法进行植被分 类的研究,以WordView・2遥感影像为基础数据,采用支持向量机分类器,最终实现 了植被的精细分类(杨盼盼,2017) o
综合以上研究可以看出,利用高分辨率遥感影像进行分类时,面向对象的分类方 法具有较强的适用性,分类精度较高。
1.2.3.机载LiDAR研究现状
目前机载LiDAR已广泛应用在林业方面,由于机载LiDAR可以穿透森林冠层, 因此可以有效的估测森林结构参数,在单木的提取以及森林模型的模拟等方面也有较 多应用(Heinzel et al., 2011;庞勇等,2005)。
近年来,许多学者一直在发掘LiDAR数据的应用潜力。Popescu等使用LiDAR 数据结合多光谱数据进行树高的估测,最终显示利用LiDAR数据和光学数据融合的 方法对不同林分树高的估测都得到了较好的结果(Popescu et al., 2004)。Hollaus等使 用LiDAR数据对单木树高进行提取,发现提取的树高与实测的树高具有一致性 (Hollaus et al„ 2006)。庞勇等利用机载LiDAR数据提取树高,研究发现,利用分位 数法对林分平均高的估计精度较高,总体平均精度达到90.59%,其中阔叶树精度相 比于针叶树精度要高(庞勇等,2008) o李文娟等利用机载LiDAR数据结合野外调査 数据,对灌丛地上生物量的空间分布进行研究,结果表明,LiDAR数据能够较精确 的估计灌丛的平均高度(李文娟等,2015) o刘峰等利用小光斑LiDAR数据对湖南中 亚热带常绿阔叶林进行研究,估测林窗面积和边界木高度,结果显示,估测的边界木 高度平均比野外观测值低9.9%(刘峰等,2015) o曹林等利用小光斑全波形LiDAR数 据,提取空间位置信息,得到的点云特征变量中,平均高与各林分特征之间的相关性 较高,其中估算精度最高的为树高模型(曹林等,2015) o在利用机载LiDAR数据进 行植被识别的研究中,Holmgren基于LiDAR数据采用监督分类方法进行植被识别, 结果表明LiDAR数据可用于区分挪威云杉和欧洲赤松(Holmgren et al., 2004)o Reitberger等以全波形激光雷达数据为基础数据,利用分水岭算法从冠层高度模型中 提取树冠,并采用非监督分类方法实现了针叶林和阔叶林的分类(Reitberger et al., 2008)。Heinzel等利用波形数据特征对树种进行分类,共区分6种树种,总体精度为 57%(Heinzel et al., 2011)。Zhang等基于LiDAR数据的结构和强度特征进行树种的识 别,结合支持向量机分类器对山毛棒和合欢两种树种进行了分类,总体分类精度达到 T 92.8%,同时证明了支持向量机分类器的分类精度明显优于线性判别分析等传统分
类方法(Zhang et al., 2013)。
综合以上研究可以发现,利用LiDAR数据进行林分高度的估测精度较高,效果 较好,但要想进行树种的识别与分类,仍存在一定的难度和限制。
第二章介绍了研究区的概况和数据的获取,说明了数据的预处理方法及结果,建 立了分类体系并介绍了样本的选择情况o
第三章介绍了面向对象的分类,包括图像分割和分类方法的选择。具体介绍了多 尺度分割算法,并构建多层次最优分割参数,以及各分类方法的概念和原理,精度评 价方法等。
第四章详细阐述了特征的提取,包括ICA变换特征、光谱指数、纹理特征、以 及LiDAR的CHM特征,并根据树种的光谱曲线构建了新的指数特征。同时介绍了 随机森林算法以及进行特征筛选的原理,对筛选结果进行分析。构建了多维的特征空 间,为树种分类提供基础和保障。
第五章首先介绍了分层分类的具体流程及结果,在最优分割参数下,对非林地、 其他林地及有林地进行区分与提取,再对有林地进行树种的精细分类。确定了分类方 案,同时详细阐述了不同分类方案结合多种分类器进行树种分类的结果,并进行精度 评价。对结果进行分析与总结,确定最佳分类方案和分类方法。
第六章是结论与讨论,总结了本研究的研究结论和创新点,并针对面向对象的特 征提取、植被指数、纹理窗口的选择以及树高在树种分类中的应用等问题进行了讨论。
3.面向对象分割与分类方法
面向对象分类是将具有相同或相近属性的邻近像元组成一个对象,并将对象作为 分类的基本单元。面向对象分类的关键技术主要包括图像分割和分类算法,图像分割 是面向对象分类的基础。本章节将对这两个关键技术作详细介绍。
3.1.图像分割
图像分割的准确度显著影响面向对象的分类精度,因此找到最适合的分割方法和 分割尺度很重要。eCognition软件中包括棋盘分割、四叉树分割和多尺度分割等多种 分割算法。如图3.1所示,为利用不同分割算法的影像局部分割结果。从图中可以看 出多尺度分割具有较好的分割效果,分割边界最符合实际地物的情况,同时对于不同 的地类可以设置不同的分割尺度,能够充分利用光谱信息和空间信息,适用性较强, 应用广泛。因此本文选用多尺度分割算法进行影像的分割。
  

4.特征提取和分析
不同树种的光谱特征具有一定的差异,结合空间信息以及其他辅助信息能够更加 准确的对树种进行区分。在本研究中,共提取了四组特征用于树种分类的研究。
4.1.高光谱影像特征提取
4.1. 1. ICA变换特征
高光谱遥感影像具有多波段的特点,但波段之间具有一定的相关性,造成了信息 冗余,对所有波段进行研究不仅耗时长,且过多的冗余信息还会影响分类的精度,因 此,可以对数据进行降维处理,从多波段之中提取有效信息。独立主成分分析(ICA) 是一种常用的波段降维手段,可以把多光谱或高光谱数据转换成相互独立的部分。该 方法是在统计独立的假设下,对混合信号进行分离,通过矩阵变换去除干扰信息,获 取原始信号特征,这种变换要比主成分分析得到的结果更加有效(Dabirietal., 2018)。
对预处理后的高光谱图像进行独立主成分分析,变换后的前5个主成分中包含了 所有波段99%以上的信息量。如图4.1为独立主成分分析各分量特征值的变化情况, 横坐标为变换后各分量波段,纵坐标为各分量所对应的特征值大小,可以发现在第五 个分量之后,特征值变化缓慢接近为0。因此,本研究利用前5个主成分作为光谱变 换特征变量参与分类研究。
5.基于机载高光谱和LiDAR数据树种分类
许多研究表明,由于复杂的林分结构和环境条件,导致很难提高树种分类的精度, 然而林地和非林地(建设用地和水体)的光谱特征区别明显,很容易区分,因此采用 分层的方法可以比较准确的划分林地和非林地。为了保证研究区整体分类精度,并分 析多特征进行树种分类的潜力,首先采用分层的方法,利用阈值的方式将研究区分为 林地和非林地,再将林地分为有林地和其他林地。对于有林地,利用提取的特征进行 KNN、SVM和决策树的树种精细分类,以确定研究区最佳的分类方案及分类方法, 提高树种分类精度。
6.结论与讨论
6.1.结论
本研究利用机载高光谱影像和LiDAR数据进行面向对象的树种分类。从机载高 光谱数据中提取了 ICA变换特征、植被指数和纹理特征,通过分析树种的光谱曲线, 构建了新的光谱指数,从LiDAR数据中提取了 CHM特征,将这些特征进行特征组 合和特征筛选,采用分层分类的方法结合KNN、SVM和决策树三种分类器进行面向 对象的树种分类,比较分析不同特征组合对分类精度的影响及作用,以确定最佳分类 方案和分类方法。结论如下:
(1) 在图像分割中,采用多尺度分割方法,利用ESP尺度评价工具获得最优的 分割尺度,结合地物实际情况,建立多层次的最优分割参数,当分割尺度为55,形 状因子0.3,紧致度因子为0.6时,为建设用地、水体及其他林地的最优分割参数, 当分割尺度为5,形状因子0.1,紧致度因子0.4时,为树种分类的最优分割参数。多 层次分割可以更好的区分不同地物边界,分割效果最符合实际地物轮廓,可在一定程 度上提高分类精度。
(2) 采用面向对象与分层分类相结合的方法,在建设用地、水体及其他林地最 优分割尺度下,进行分层提取,利用阈值分类的方法精确的划分非林地、其他林地与 有林地,区分效果较好,符合地物的真实边界,最后对有林地进行树种的精细分类, 避免了各树种与其他地物的混分现象。
(3) 利用多种特征组合进行不同分类器的树种分类,基于SVM分类器的分类 效果最好,在不同分类方案中分类精度都高于其他两种分类器。说明SVM分类器对 于多维的样本集以及训练样本有限的情况下,能够表现出更好的性能。利用随机森林 筛选特征进行树种分类,SVM分类器总体分类精度达到最高为94.20%, Kappa系数 为0.9307,决策树总体分类精度达到85.10%, Kappa系数为0.8324,相比于利用所 有特征分类精度分别提升了 1.02%和1.46%,通过消除冗余特征,能够进一步提高分 类器的性能和效率。
(4) 在筛选的特征子集中,ICA变换特征和光谱指数特征排名靠前,证明了光 谱特征在树种分类中具有重要作用,新构建的光谱指数SR作为优选特征,对提高树 种分类精度具有一定作用,增加了各树种之间的可分性。其他筛选的光谱指数都与近 红外波段和绿光波段相关,同时与植被的叶绿素、类胡萝卜素和花青素等具有较强的 关系,因此利用这些因素可以有效区分不同树种。纹理特征在优选的特征中排名比较 靠后,说明纹理特征可以作为辅助特征提升树种的分类精度。
(5) 不同分类方案中,纹理特征的加入,各分类器的分类精度都有明显提升, 八角、马尾松和湿地松的分类精度的提升要明显高于其它种类的阔叶树种,分析本研 究提取的纹理窗口大小较适用于冠幅较小的树种,对提升小冠幅树种的分类精度贡献
较大。加入CHM高度信息后,进一步提升了各树种的分类精度,尤其是八角树种的 分类精度提升较大,其制图精度基于三种分类器分别提高了 1.78%、13.46%和9.62%, 减少了与其他阔叶树种的混分现熟 说明高度信息在树种光谱特征相似时能够起到重 要作用,减少了 “异物同谱,同物异谱”的干扰。因此应用多维特征,可以有效提升 树种分类精度。结合两种数据源的分类方法对复杂森林类型的树种精细分类是有效的, 满足树种分类的精度需求。