基于概率密度变化特征的气候突变 早期预警信号研究

来源: 未知 作者:paper 发布时间: 2020-05-17 15:08
论文地区:中国 论文语言:中文 论文类型:工程硕士
第一章绪论 本章先介绍气候突变的定义及其影响,然后介绍气候突变的研究进展及存在的科学 问题,在此基础上总结分析了目前气候突变早期预警中存在的一些问题,进而提出本文 所
第一章绪论
本章先介绍气候突变的定义及其影响,然后介绍气候突变的研究进展及存在的科学 问题,在此基础上总结分析了目前气候突变早期预警中存在的一些问题,进而提出本文 所要解决的关键科学问题、研究目的及主要研究内容,本章的最后概括本论文的结构框 架。
1.1气候突变的定义及其对社会经济的影响
自然界中,系统在有序演变的过程中,可能会出现不同状态之间的转换。其中快速、 跳跃式的转换就是突变。一般地,气候突变定义为气候系统从一种稳定状态跳跃式地转 变到另一种稳定状态的现象[⑶。突变往往是灾难性的转换,有时甚至是不可逆转的。突 变现象广泛存在于非线性复杂动力学系统中,并在很多领域引起了研究人员的关注。例 如在生态学领域中234],由于含磷物的过度投入,导致浅滩湖泊富营养化;因生态环境 改变而突然崩溃的珊瑚礁生态系统;由过度放牧导致的半干旱地区草地荒漠化等等。在 金融市场中,金融系统突然崩溃⑸。在空间天气学领域中,地球磁场长时间尺度上的突 变,由于行星际扰动造成银河宇宙线通量突然减少的Forbush Decrease^FD)事件⑹,太 阳风动压突然地增强和减弱引起的高纬度电离层的突变⑺等等。气候领域中,由于降水 增加、冰川融化等原因导致大量淡水汇入北大西洋,从而使得大西洋经向翻转环流 ^Atlantic Meridional Overturning Circulation, AMOC^)崩溃〔&刃;古气候突变,如因为 AMOC 减缓或停止等原因造成的新仙女木事件am;随着热量平衡的变化,东亚夏季风会岀现 一些突变[12]等等。气候突变往往会引起自然生态环境的巨大变化,从而导致生态资源和 社会经济的大量损失。而且为了使发生突变后的系统恢复到先前状态可能需要采取非常 昂贵的干预措施,甚至有时突变可能无法逆转。对于生态环境的影响方面,由于自然生 态系统的适应能力有限,其遭受气候突变破坏的可能性高且被影响的空间范围大。气候 突变可能导致一些自然生态环境不再适宜某些生物生存,从而影响生物种群的结构、组 成以及生物量,甚至造成物种灭绝、生物多样性减少Hl。吴文祥等人研究认为,历史上 一些古代文明的衰落可能与气候突变有关[15]。AMOC是全球气候系统中的关键组成部 分,通过模型的数值试验,有研究人员发现它的减弱或者崩溃可能导致全球气温突变89], 其影响的范围之大和严重性之强是显而易见的。
另一方面,社会经济也会受到气候突变的严重影响。气候突变会导致气候条件发生 急剧的变化,从而影响农业的生产布局和结构、地表径流、水资源的质量及其分布、人 类居住环境等等,甚至某些传染病也可能由于气候条件的改变而更利于传播,导致灾难 性的后果[⑹。由此可见,气候突变可以从很多方面影响自然生态环境、社会经济发展, 因此,预测预警可能发生的气候突变,有利于社会和公众提前开展针对性的防范措施, 可以在一定程度上降低其带来的不利影响。针对这一问题,许多研究者围绕气候突变展 开了大量研究。
第二章研究方法和模型
本章先分别介绍研究的三种预警信号,即偏度系数、峰度系数、兀变换的定 义和计算公式,包括简单的数学意义。然后介绍了本文使用的四种折叠分岔模型。
2.1偏度系数
状态变量X的偏度一般定义为其三阶中心矩除以标准差的三次方,是一种表征状态 变量X概率分布不对称程度的度量QI。具体公式如下:

其中,丫表示偏度,传表示三阶中心矩,CF3表示标准差的三次方,X是状态变量,“表 示X的均值,刃表示X时间序列的长度,E表示数学期望。
如果状态变量X满足正态分布,则其时间序列的偏度为零;如果偏度值为负,则称 为负偏态又称作左偏态,在其概率密度分布图上表现为左侧的尾部更长,且分布的主体 集中在右侧;反之则反之。状态变量X的时间序列长度达到足够长度之后,偏度的计算 结果才为有统计意义。在本文的所有数值试验中,时间序列的长度经过验证计算,都是 足够长的,详见各个预警信号的样本量影响部分(3.3、4.3和5.4小节)。需要注意的是, 本文根据Guttal⑴的计算方式,使用偏度的绝对值表示偏度系数,即本文中展示的偏度, 除非特别说明均取绝对值。
2.2峰度系数
状态变量X的峰度一般定义为四阶中心矩除以标准差的四次方,用于表征概率密度 分布曲线在平均值处峰值的高低QI。具体公式如下:

其中,丘4表示四阶中心矩,o■"表示标准差的四次方,X是状态变量,“表示X的均值, 刃表示X时间序列的长度,E表示数学期望。
因为正态分布的峰度值为3,所以常常将峰度值减3,即超值峰度(excess kurtosis), 本文中使用的也是超值峰度。因此,除非特别说明,之后本文中所指的峰度均指超值峰 度。峰度大于零,称为尖峰态(leptoku讥ic),在概率密度分布图上表现为,均值处峰值 的概率密度高于正态分布;峰度小于零称为低峰态Qplatykurtic},与尖峰态相反。与偏 度系数类似的处理方式,本文用于计算峰度系数的时间序列长度足够长,且本文展示的 峰度,除特别说明也取绝对值。
2.3 Box-Cox变换系数
Box和Cox在1964年提出Box-Cox变换。在数据统计处理中,Box-Cox变换可以 在一定程度上减少数据的不对称性,改善数据的正态性等,用于将数据从非正态分布转 化为正态分布[旳。变换公式如下:
显然,X的Box-Cox变换是一个变换族,由可变参数2决定具体的变换形式,当2 = 0时, 该变换为对数变换。通过数据本身,用最大似然估计法得到估计参数2,进而确定应采 取的数据变换形式,可以发现Bo炉Cox变换的关键就是参数久。参数2可以从另一个角 度反映数据的不对称程度,因此本文尝试使用参数2作为新的早期预警信号。因为正态 分布序列的2参数值为1,所以为了方便,我们将参数2减1作为衡量系数。与之前两 者一样,2系数除非特别说明均取绝对值。
第三章噪声和缺测对偏度系数的影响研究
偏度是一种被广泛研究使用的突变的早期预警信号,但是并没有系统地研究观测噪 声、缺测和样本量对其的影响。于是本文使用GW加/⑴等人提出偏度作为预警信号时使 用的三种模型,以及一个广泛研究使用的气候模型,系统地研究了不同强度的高斯白噪 声(模拟观测误差)、不同程度的缺测和样本量对于偏度作为预警信号的影响。本部分 将分别展示噪声以及缺测对于偏度系数作为早期预警信号的影响结果。因为样本量未达 到足够数量时,计算偏度等统计学特征参数是没有意义的,所以本部分也研究了样本量 对于偏度系数的影响。
第四草 峰度系数作为早期预警信号的研究
峰度与偏度类似,也是一种被广泛研究的预警信号,但也缺乏噪声、缺测和样本量 对其的系统性研究。Biggs^等人使用了少数的模型研究了峰度的预警信号性能,而本 文研究了在这四种模型中的峰度的适用性以及噪声、缺测和样本量的影响。本章节主要 研究了不同强度的高斯白噪声、不同程度的缺测和样本量对峰度作为早期预警信号性能 的影响。本部分计算峰度系数的数据第三章相同,展示结果的方式也与第三章相同,便 不再详细描述。
4.1噪声对峰度系数作为早期预警信号性能的影响
本部分研究了各个模型下,峰度系数的结果。因为使用的时间序列数据与计算偏度 系数的时间序列数据相同,所以关于模型参数选取以及数据处理方式便不再重复说明。
首先展示模型一的结果,图4丄1为不同强度的噪声对于峰度系数的影响结果。图 中黑色虚线为原数据得到的峰度系数,蓝色实线、红色点线和绿色点划线分别描述了含 5分贝噪声、含10分贝噪声和含20分贝噪声的数据的峰度系数结果。

图4.1.1不同强度的高斯白噪声对模型一的影响结果。图中x轴方向表示接近突变的方向,黑色 虚线、蓝色实线、红色点线和绿色点划线分别表示对应于原数据、含5分贝噪声数据、含10分贝噪 声数据及含20分贝噪声数据的峰度系数。
从图中可以发现即使是没有噪声的情况下,峰度系数的表现效果也不是很好,在非 常接近突变的时候才出现明显的下降趋势,且最后还有一小段上升趋势,而远离临界点 时是缓慢的上升趋势。20分贝的噪声几乎全程都没有明显影响。而在远离临界点(350 个时间单位之前)时,10分贝和5分贝噪声的影响是显而易见的:使得峰度系数的数值 减小。但在350个时间单位之后,即起到预警效果的部分,这三种强度的噪声无论是对 峰度的数值还是对预警时间都没有明显影响。因此,可以认为噪声在模型一中,对峰度 系数作为早期预警信号性能的影响几乎可以忽略。
图4.1.2在模型二和模型三的两条路径中,噪声对峰度系数的影响。(°)为模型二中,路径一的 结果;@)为路径二的结果。(c)为模型三路径一的结果,(0为路径二的结果。图中x轴正方向为靠近
突变的方向,黑色圆圈、蓝色正方形、红色三角形和绿色五角星分别表示原数据、含5分贝噪声、
含10分贝噪声和含20分贝噪声数据的平均峰度系数。
图4丄2展示了模型二和模型三的结果。如图所示,20分贝的噪声在四种情况下都
是几乎没有影响的。而对于10分贝的噪声,在路径一中的影响明显是大于路径二的, 即路径一中已经与原数据的变化趋势产生较大差别,但是路径二中影响程度较小。相比 于10分贝的噪声,更强的5分贝噪声对峰度系数的影响更大,使得峰度系数的数值更 小且预警时间明显缩短。
因为20分贝、10分贝和5分贝噪声对于模型四的数值结果影响较大,所以在模型 四中仅考虑更小的25分贝、30分贝、35分贝和40分贝噪声的结果。图4丄3展示了模 型四中,小噪声对于峰度系数的影响结果。如图所示,在远离临界点(/<= 0.875)时, 噪声使得峰度系数数值几乎为零,即含噪数据的概率密度分布几乎与噪声相同。当靠近 临界点时,即峰度系数作为预警信号起到预警作用时(1>= 0.875),噪声使得峰度系数 数值减小,预警时间缩短。并且随着噪声强度逐渐增大,开始出现增长趋势的系统状态 逐渐向临界点靠近一个分辨率(即刃= 0.015),例如含有35分贝噪声时,出现明显增 长趋势的系统状态为I = 0.905,比40分贝噪声的预警状态I = 0.89更靠近临界状态的 I q 0.965 o

图4.1.3对于趋近模型四临界点过程中,小噪声(即25分贝、30分贝、35分贝和40分贝)对 峰度系数作为预警信号性能的影响。图中x轴正方形为接近临界点的方向,黑色圆圈、蓝色正方形、 红色三角形、绿色五角星和粉色菱形分别表示原数据、含25分贝噪声、含30分贝噪声、含35分贝 噪声和含40分贝噪声数据的峰度系数。不同类型的曲线为简单的连接,起到引导视线的作用。因为 图像在心0.7之前的变化趋势不明显,所以图中仅展示了 / = 0.7之后的结果。
总得来说,噪声对峰度的影响效果与偏度几乎一致,即噪声减小峰度的数值,缩短 预警时间,且影响程度随噪声强度的增大而增大,而强噪声可能使峰度完全失效。
第五章 基于Box-Cox变换的气候突变早期预警信号的应用研究
前人的研究发现,通过时间序列的概率密度分布的微小变化可以在一些系统中预测 突变的来临。偏度和峰度作为描述概率密度分布不对称程度的度量,在许多不同领域中 存在关于其预警性能的研究,但是结果发现在一些系统中存在失效的情况。本文提出另 一种描述不对称程度的参数,即Box-Cox变换的久系数可以更敏感地反映出不对称程度 的变化,因此可以作为一种新的早期预警信号。本章先研究久系数在四种模型中的预警 性能,然后同样地研究了噪声、缺测以及样本量对于久系数的影响。
研究久系数的预警性能以及噪声、缺测、样本量对其影响时,计算使用的数据和其 他两种预警信号基本相同。因此除特殊说明外,使用的数据默认与前两种预警信号相同, 不再详细说明。除了研究预警性能时添加了误差棒,以表示多次重复试验的平均值的标 准偏差,其他结果的展示方式几乎与偏度、峰度这两种预警信号相同,不再详细说明。 5・1 2系数作为早期预警信号的性能测试
本部分分别展示四个模型中,久系数早期预警性能的研究结果。由于使用的数据与 前两章计算偏度系数和峰度系数的数据相同,便不再重复说明,展示方式基本相同,但 是在展示预警性能的结果时,增加了多次重复试验时的平均值的标准偏差作为误差棒。


图5.1.1模型一中久系数的结果。图中@)展示原数据,图(6为久系数的结果。截取的数据为401.2 个时间点。灰色竖虚线表示计算久系数的固定滑动窗口长度,为原数据长度的一半:200.6个时间点。 红色虚线表示偏度计算的截止点,提前数据10个时间单位,即截止于第391.2个时间点。图中使用 的数据和方法,都与其他两个预警信号相同。
第六章三种预警信号的对比研究及实际应用
为了更好地研究久系数的优缺点,本章节通过与偏度系数、峰度系数的对比展开了 相关研究。更具体地,分别研究了原数据的对比、含不同强度噪声时的对比,以及样本 量的归一化对比。因为缺测在本文的所有试验中,对于这三种预警信号几乎都没有明显 影响,于是不考虑缺测时的对比研究。除了样本量归一化的对比研究,其余对比结果均 为各章节中展不的结果。
此外,本文将三种预警信号应用在空间天气学领域的实际观测数据中,即福布斯下 降(Foybush Decease)事件的预警应用。
第七章总结与展望
7・1总结
本文以气候突变的早期预警信号为研究方向,主要进行了两个方面的研究。一方面 为噪声、缺测以及样本量对早期预警信号的研究,另一方面是提出新的早期预警信号
Cox变换的久系数)并与偏度、峰度这两种基于同一原理的预警信号进行对比研究, 以及观测数据的应用。第一方面的内容包括本文的第三章到第五章,系统地研究了不同 强度的高斯白噪声(模拟观测误差)和不同程度的缺测对于早期预警信号的影响,以及 不同预警信号趋于稳定时所需要的样本量长度,即样本量对预警信号的影响。更具体地, 通过对原数据添加不同信噪比的高斯白噪声,模拟不同程度的观测误差;随机删除不同 数量的数据,模拟不同程度的缺测情况;计算不同样本量下的结果,研究样本量的影响。 第二方面的内容包括第五章和第六章,第五章利用Box.Cox变换中久系数可以表示不对 称程度的特性,基于系统在突变来临前,其系统状态的概率密度分布不对称程度可能发 生变化的原理,提出久系数的改变可以作为一种新的早期预警信号。第六章将新提出的久 系数与偏度系数、峰度系数进行多方面对比研究。并且将三种预警信号应用在空间天气 观测数据中。全文以研究早期预警信号的性能为主线,为了进行多方面对比,先研究了 偏度系数和峰度系数的抗噪声能力、缺测以及样本量的影响,然后研究了久系数在不同 模型中的表现效果,之后三者进行多方面对比研究,最后将这三个预警信号应用于空间 天气的实际观测数据中,最终构成全文。本文的主要结论可以总结如下:
(1)噪声、缺测以及样本量对早期预警信号的影响
研究发现,噪声对于不同的模型影响程度是不同的,比如模型一即使是较大的信噪 比为5分贝的高斯白噪声,对于三种预警信号的影响也是可以忽略的,而模型四对于较 小的20分贝噪声也会让三种预警信号全部失效。虽然噪声的影响程度不同,但是影响 效果基本一致,即噪声会使得预警信号的数值下降、预警时间缩短,并且影响程度随噪 声强度的增加而增大,当噪声强度达到一定程度时,强噪声甚至会几乎完全覆盖原数据 的趋势,使得含噪数据的变化趋势呈现为噪声的变化趋势,因而导致预警信号失效。因 此,实际应用时可以考虑先使用滤波等方法消除噪声的影响之后,再进行早期预警信号 的使用。
缺测在本文的所有试验中(最多达到总样本量的20%)几乎都是没有影响的,更稳 定的结论有待进一步研究。唯一出现略微影响的是模型一缺测样本总量的20%时,峰度 系数由原来的效果不佳变为没有预警效果,其他预警信号都是几乎完全没有影响。
对于样本量的影响,一般地,样本量长度需要达到一定程度,才可以保证预警信号 有统计意义。而样本量长度越长越好,因为当样本量长度过长时,一方面会增加计算量, 另一方面可能因此延迟预警时间。本文使用的样本量长度都是足够长的,系统状态的预 警信号是有统计意义的。
(2) 久系数作为早期预警信号的性能
在本文的模型试验中,当系统中2系数与偏度、峰度都有效时,久系数与偏度系数的 预警时间相近,且都比峰度系数早,但是久系数的变化幅度大于偏度系数、峰度系数。 也就是说,久系数对于不对称程度较为敏感,当不对称程度发生微小变化时,久系数便可 以做出反应。
当偏度系数和峰度系数都失效的一种情况,即几乎没有变化趋势时,久系数会出现 明显变化趋势。
当添加噪声之后,久系数的变化数值仍大于其他二者。因为缺测对于三者几乎都没 有影响,便没有比较。
也存在偏度系数或者峰度系数有效而久系数失效的情况。因此多种预警信号相互弥 补,整合为一个复合信号也许是一个更好的方法。
(3) 在FD事件中的应用
在三个事例中三种预警信号都可以提前4天左右,出现明显变化趋势。这三种预警 信号对2事件可以起到一定的预警作用,更稳定的结论还有待进一步研究。