截止目前累计成功为5,000,000 用户成功查重检测

CNCNKI学术不端文献查重检测系统 多语种 图文 高校 期刊 职称 查重 抄袭检测系统

基于空间统计的南京市雾霾影响因素分析

时间:2016-07-01 20:24:00 编辑:知网 阅读:

雾霾是空气污染物和特定气象条件共同形成的一种天气。在相对湿度比较大并且静风的条件下,大气对流较少,风力小,此时大气相对较为,相似粒径的颗粒物分层结构也很稳定,污染物很难在垂直和水平方向上进行扩散,十分集中,使得污染物颗粒一直聚集在城市及其附近区域的上空,导致污染物颗粒浓度升高。其中研究发现,颗粒物粒径为2.5微米的颗粒(PM2.5)与雾霾的产生密切相关。PM2.5 又称“可入肺颗粒物”,是空气动力学中当量直径小于或等于2.5 微米的细颗粒物的总称。在秋冬季节时,空气湿度相对大,更促进了烟,灰尘等PM2.5颗粒的吸湿增长,从而产生雾霾。2013年一月份,我国爆发了大面积雾霾,雾霾问题第一次成为了人们关注的热点问题。在沿海地区以及北京、天津、山西、河北、广州等地因雾霾天气频发大雾预警。

近年来,随着空气质量问题越来越严重,雾霾在社会生活和人类健康方面的影响越来越明显。在交通方面, 阴霾天气使能见度降低,影响道路安全,甚至容易导致重大交通事故。在人体健康方面,PM2.5颗粒表面能吸收大量的有毒、有害的物质,通过鼻呼吸进入肺部和血液,导致呼吸系统和心血管系统疾病,加重慢性疾病,引起人体免疫力的结构变化,危及人体健康[1]。在生态环境方面,一方面,由于大量的PM2.5颗粒的聚合,干扰了太阳对地球的太阳辐射,影响光合作用,降低农产品的输出。另一方面,雾霾中由于煤炭等燃料燃烧产生的二氧化硫气体容易沉淀和酸雨的形成,极大的危害了土壤、河流和建筑物。

针对近年来时常爆发的大规模严重雾霾天气,为了制定有效的控制措施,进一步深入研究雾霾形成的影响因素,许多环境气象等领域的学者从不同切入点对雾霾的影响因素做出了研究和分析。

在雾霾成分分析方面,Okada,Kanga等对雾霾组成成分进行了细致分析,研究了主要导致雾霾现象的溶胶粒子特性;曹伟华,李青春等选取1980—2010 年逐日气象资料对北京地区的雾霾时空特征进行分析[18];冯少荣,冯康巍采用两种不同统计方法对全国18个城市影响雾霾因素进行分析,并且对比了不同分析法的优缺点[16];魏巍贤,马喜立用可计算一般均衡( CGE) 模型,研究中重点在于治理大气污染的经济手段,主要通过政策模拟得出推动有效治理雾霾的方法[8]。靳会超利用ArcGIS软件,对城市雾霾的形成过程及其雾霾的影响因子进行了较为全面的分析[4]

由于城市雾霾爆发的持续性和大面积性,采用常规的方法难以直观、宏观的分析研究区。空间统计学是以区域化变量理论为基础,研究具有地理空间信息特性的实物或现象的空间相互作用及变化规律的学科。

但由于在数据收集上遇到的种种困难,经过多次调整技术路线,本文主要结合空间统计方法和传统统计方法对南京市雾霾影响因素进行分析:(1)阅读分析当前国内对雾霾研究的各项文献资料,对比分析理论方法,并且收集获取南京市DEM、modis气溶胶产品、气象数据以及社会经济数据等;(2)知网论文查重对收集的DEM数据进行裁剪等基本处理,再利用GEODA对南京市各区PM2.5的空间相关性进行分析,利用SPSS分析南京市雾霾影响因素。(3)通过分析得出的结果,对南京市雾霾的防治提出一些建议。

空间统计学是以变异函数为主要工具,以区域化变量为基础,研究具有空间信息特性的事物或现象的空间相互作用及变化规律的学科。空间统计研究起步于上个世纪70年代,其依据是地理学第一定律:“空间上越临近的事物拥有越强的相似程度;和空间异质性,即空间位置差异造成的行为不确定现象。”目前,国内外的学者已对空间统计学的一些基本理论进行了研究,并且广泛应用于地理环境、经济、人口、农业等各个领域。

空间统计通过空间位置来建立数据间的统计关系,认识数据间的空间依赖、空间关联等关系是空间统计的核心 [21]。其内容包括了空间权重矩阵的构建、空间自相关的度量与检验、空间关联的识别等方面的知识。

在实际研究过程中,空间统计分析和经典统计作为研究手段经常是被结合到一起使用,来进行深入的分析。空间统计分析一方面采用统计的方法,对空间数据进行解释。另一方面它又具有自己独有的空自相关分析。主要分析内容包含以下几点:

  1. 基本统计量。统计量是数据特征的反映,也是统计分析的基础。
  2. 探索性数据分析。探索性数据分析能让数据和研究对象更好地被认知,因而用户在数据相关的问题上能够做出更好的判断。
  3. 分级统计分析  分级统计是对数据的进一步处理分析,以便于更好得揭示数据规律或在制图中获得更好的效果。
  4. 空间插值  基于探索性数据分析结果,选择合适的数据内插模型,由已知样点来创建表面,研究空间分布。
  5. 空间回归  研究两个或两个以上的变量之间统计关系,通过空间关系,包括考虑空间的自相关性,把属性数据与空间位置关系结合起来,更好的解释地理事物的空间关系。
  6. 空间分类 基于地图表达,采用与变量聚类分析相类似的方法来产生新的综合性或者简洁性专题地图。包括多变量统计分析,如主成分分析、层次分析,以及空间分类统计分析,如系统聚类分析、判别分析等。

 

临近的地理实体往往比相距遥远的实体更加具有相似性。这个观点来自地理学第一定律:“空间上越临近的事物拥有越强的相似程度和空间异质性,即空间位置差异造成的行为不确定现象。”空间相关性是地理空间内一个属性的协同变化:包括正相关和负相关,特征在近地点是相关的。空间异质性是地理空间内一个属性的聚集性在更大空间范围内呈现的空间分布差异。

空间相关性说明了样本数据是并不是独立的,所以不应该直接使用经典统计学来来分析空间数据,否则结果将出现误差。空间异质性则表明了样本数据非同质和给非等概率,使用分层统计(startified statistics)。

空间数据具有三大属性,分别是空间属性、时间属性和专题属性,其中,时间和专题属性通常被归为非空间属性。空间属性是指空间对象几何特征(如位置、形状、大小等),以及与相邻物体的拓扑关系;时间属性是指空间数据总是在某一时刻或者时间段内取得的或者产生的;专题属性是指以上两种属性以外的空间现象的其他特征。由此,空间数据提供两类信息:一是定位数据和拓扑数据;二是描述研究对象的时间属性和专题属性。空间自相关就是对第一类信息的描述。

空间自相关(spatial autocorrelation)衡量的是邻接区域内各空间单元属性值的相似程度,反映的是在一个地区单位上的某种地理特征或某一属性值与邻近地区单位上同一特征或属性值的相关程度,一般使用全局自相关和局部自相关两种指标加以度量。

也就是说空间自相关指的是变量通过空间邻近与本身的相关:

(1)在空间分布的一个变量,如果呈现出任何系统的模式,它被认为是空间自相关;

(2)如果附近或者周边地区更一样,这是正的空间自相关:相似的值趋向于彼此毗邻;局域地理差异变得抑制;区域变异的统计度量趋于显著;

(3)负的自相关描述周边地区呈现不同的模式:不相似的值趋于互相毗邻;局域地理差异变得显著;区域变异的统计度量趋于不显著;

(4)自由格局呈现出无空间相关。

空间自相关分析可分为两类:全局空间自相关分析(Global autocorrelation analysis)和局部空间自相关分析(Local autocorrelation analysis)。全局空间自相关分析是对数据集预计整体的空间自相关程度。但由于并不一定总是均质分布,所以也存在空间异质性(Spatial heterogeneity ),这表明不同地区的自相关程度可能有显著的差异。局部自相关分析首先将整个空间划分为多个单元,并且评估各单元的依赖关系。Moran'sI,Geary'sC和Getis-OrdG统计量的全局和局部形式可分别用于全局空间自相关和局部空间自相关分析。

因为空间自相关衡量的是邻接地区内空间各单元属性值的相似程度。因此首先要确定好单元之间的邻接关系再来计算空间自相关指标。

 

首先来定义一个二元对称的空间权重矩阵,我们将用这个矩阵来描述n个位置的空间单元的邻接关系。

(2-1)

空间矩阵的构造必须满足“空间相关性随着距离的增加而减少”的原则。

建立空间权重矩阵是在对空间关系进行建模,同时这也是对于待研究地区空间关系的认知。 首先需要判断i与j是否为邻接关系(包括距离限定、邻接关系等)然后,互为邻接关系之间进行权重定量化(如0-1权重,反距离权重)

判断是否为邻接关系的两种规则:

(1)距离限定:

假设X与Y实际距离为a(不管是否相邻),现设定门槛距离为b(b大于a),则认定X和Y是邻接。在这里,如果采用0-1权重,那么X与Y之间权重为1,若采用反距离权重,X与Y之间权重为1/a;如果存在X与Z之间的距离超过了b,则X和Z之间不是邻居关系,权重为0。如此建立的空间权重矩阵,称其为基于距离的二进制空间权重矩阵。

(2)邻接关系:

当仅存在公共边的要素是才互为邻接关系,那么如果X和Y存在公共边时,则权重为1,否则为0;当仅存在公共点的要素才互为邻接关系,那么如果X和Y仅存在公共点时权重为1,否则为0;当存在公共边或者公共点都可以互为邻接关系时,同理。如此建立的空间权重矩阵,称其为简单的二进制空间矩阵。

因为于空间权重矩阵是对空间关系的模拟,在构建权重矩阵是主观性很强,很有可能并不能模拟出真实的空间关系。所以并不存在最优的空间矩阵,也就是说,我们无法确定一个完全描述空间相关结构的空间矩阵。那么就没有哪种权重是完全合理的。

 

用全局莫兰指数(Moran’s I)能够判断出区域属性值的分布是聚集、 离散或者是随机分布模式中的哪一种。

设研究区域中存在个面积单元,第个单元的观测值记为,观测变量在个单元中的均值记为,Moran’s I定义为:

(2-2)

为样本量,即空间位置的个数。 、是空间位置和的观察值,是在空间位置和的空间关系,当和为邻近的空间位置时,=1;反之,=0。

Moran’s I的取值在区间[-1,1]中,大于0则表示呈现正相关,小于0则表示呈现负相关,等于0则表示不相关。越接近-1,表示单元间的差异越大或分布得越不集中;越接近1,表示单元间的关系越密切,性质越相似(高值聚集或者低值聚集);接近0,则表示单元间不相关。

在随机抽样假设和正态抽样假设这两种假设情况下,对于Moran’s I的方差计算也不一样。

期望:

(2-3)

方差:

(2-4)

(2-5)

其中,,,

Moran’s I的期望值是区分空间自相关是正还是负的参照。当I等于E时,表明研究区域是一种随机的区域分布模式,不存在空间自相关;当I大于E时,表明研究区域中相似的属性值聚集在一处,存在正的空间自相关;当I小于E时,表明研究区域中不同的属性值聚集在一处,存在负的空间自相关。

接着,令

(2-6)

一般通过标准化统计量Z,来检验个区域是否存在空间自相关的关系及其显著性。当Z值为正且显著时,表明存在正的空间自相关,这种情况下相似的观测值趋于空间聚集;当Z值为负且显著时,表明存在负的空间自相关,这种情况下相似的观测值趋于较为分散地分布;当Z值为零时,这种情况表明观测值呈独立随机分布。本文中,当Z值的大小处于区间[-1.96,1.96]内时相应统计量在0.05的水平上并不显著,当Z值大于1.96或者小于-1.96时相应统计量在0.05的水平上统计显著。

 

   全局空间自相关的统计量是对整个研究区统计出的统计量。在整个研究区域中,有可能在某些地区上空间自相关的值为高,而别的一些地域上的值就可能是低的,但很有可能在研究区的某一部分中找到正的空间自相关而在研究区的另一部分中找到负的空间自相关。 所以我们需要进一步地研究局部空间自相关性。

局部空间自相关统计量LISA的构建中必须满足一是所有局部空间自相关统计量的和等于对应全局空间自相关统计量。二是应该要体现每个空间位置的观察值是否与其邻接位置的观察值具有相关性。

为了能识别局部空间自相关,每个空间位置的局部空间自相关统计量的值都要计算出来,空间位置为的局部Moran’s I的计算公式:

(2-7)

与全局空间自相关的Moran’s I的含义一样,局部自相关Moran’s I值高说明相似值的聚集,局部空间自相关Moran’s I值低则说明明相异值的聚集。局部Moran’s I与全局Moran’s I一样,都需要通过标准化统计量Z值来检验其显著性。

相关分析指将两个或多个具有相关性的变量元素进行分析,从而判断和衡量出两个变量之间的相关密切程度。相关分析能够判断变量之间是否存在联系;确定相关关系的表现形式及相关分析方法;把握相关关系的方向与密切程度;用来进行预测。相关分析分为线性相关分析、偏相关分析和距离相关分析。本文选用线性相关的分析相关方法。

为了更直观地判断出两种变量之间的关系,通常还用相关表和散点图来辅助分析。散点图是一种比较直观形象的描述方式,它用横轴表示两个变量中的一个变量,用纵轴表示另一个变量,将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系之中。散点图通过点的分布形状、疏密程度和分布模式来描述两个变量之间的相关关系。

但是散点图和相关表只能粗略地反映变量间相关关系的方向、形式和密切程度。相关系数才能准确地描述相关关系的密切程度。相关系数是描述这种线性关系程度和方向的统计量。相关系数的计算有三种:Pearson、Spearman和Kendall。Pearson是SPSS软件系统默认的相关分析方法,但只有正态分布的连续变量才使用这种相关分析。 当对变量值的分布明显非正态,或这对数据分布状态并不明确时,计算前,应当先对离散数据进行排序或者对连续变量的值求秩,再计算其秩分数间的相关系数,使用Kendall相关系数或Spearman秩相关系数。为了更加准确地判断出雾霾的主要影响因素,本文中采取非参数检验中的Kendall相关系数与Spearman秩相关系数共同作为双变量相关性分析的参考[16]

返回