«——【·摘要·】——»
火山二氧化硫的位置和高度的精确知识羽流对于准确测定二氧化硫至关重要2由火山爆发发出的。当前SO2基于紫外线卫星测量的羽流高度反演算法非常耗时,因此不适合近实时应用。
在这项工作中,我们提出了一种称为全物理逆学习机算法的新方法,用于非常快速和准确地检索SO2烟羽高度。FP-ILM使用监督学习方法创建光谱辐射亮度和感兴趣的地球物理参数之间的映射。FP-ILM结合了智能采样方法、降维技术以及基于主成分分析和神经网络的各种线性和非线性回归分析方案。
FP-ILM中计算量大的操作是训练数据集的辐射传输模型计算和反演算子的确定——这些操作是离线进行的。将得到的反演算子应用于实际测量非常快,因为它是基于简单回归函数的计算。销售订单的检索2展示了卡萨托奇火山(2008年)和埃亚菲亚德拉火山喷发的羽流高度,由MetOp-A上的GOME-2紫外线仪器测量
«——【·介绍·】——»
在火山爆发期间,二氧化硫和各种其他气体被排放到大气中。根据火山爆发的类型,火山灰也会散发出来,这是对当地居民和航空安全的主要威胁。因此火山活动的一个强有力的指标,它可以作为火山灰排放的代表,因为最初可与烟灰搭配使用。
火山SO的及时全球测量2因此,当火山灰咨询中心使用时,可以为减轻航空灾害提供关键信息.火山所以2对当地的空气质量有影响,而且从长远来看也对航空安全构成威胁:所以2导致飞机引擎硫化,如果长时间暴露,会导致引擎完全失效。
火山所以2和硫酸盐对全球气候也有影响。当释放到大气中时,它们会受到干湿沉降以及氧化成硫酸盐气溶胶的影响在对流层下部,所以2硫酸盐气溶胶的寿命约为3天.当被火山爆发注入平流层时2寿命只有几周,而硫酸盐气溶胶可以存在一年以上,通过太阳辐射的反射和诱导的反照率和云寿命的变化来影响地球的辐射作用力。
1991年皮纳图博火山爆发释放了大约20兆吨的二氧化硫2排放到大气中,并导致数年内全球平均气温下降约0.3-0.5摄氏度.305和330纳米之间的紫外线波长范围内的卫星测量提供了对二氧化硫最灵敏的测量2在大气中。
这有助于探测和监测火山和人为的SO2全球每日排放量.在这个波长范围内的后向散射紫外地照光谱包含了关于总SO的定量信息2负载和SO的高度2层;SO中的变化2量会直接改变光学深度,而高度的变化会影响穿过SO的光子数2层和吸收层的光学厚度。
近年来,开发了一些反演算法,用于解释红外、微波和紫外/可见光范围内反射和散射太阳辐射的卫星测量结果。本文所述方法的主要应用是用于SO的检索2火山爆发期间的羽流高度,基于诸如GOME-2等底点观测遥感仪器的紫外线测量。
因此使用例如差分光学吸收光谱法参见,例如,Rix et al .通过对SO的垂直分布进行显式或隐式假设2;DOAS对于近实时检索来说足够快。然而,检索羽流高度信息更具挑战性。目前文献中的羽流高度反演利用直接拟合技术,将正向模型计算与观测值进行比较。
不幸的是,这些拟合方法非常耗时,因此不适合NRT应用。对于下一代卫星传感器,这些限制将更加严格,具有前所未有的光谱和空间分辨率以及相关的数据量的大幅增加。本研究的目的是开发一种快速而精确的算法来检索SO2紫外地照测量的烟羽高度。
火山所以2羽流高度反演本质上是一个不适定的逆问题。在经典方法中,反问题通过将其简化为最优化中的一个练习来解决。这种方法背后的主要思想是找到最小化模拟数据和测量值之间的残差的状态向量。
非线性逆问题被迭代求解.假设先验状态向量非线性正演模型被线性化。然后,线性化的模型可以容易地被反演,并且可以找到状态向量的新估计。
这种迭代方法被广泛用于示踪气体反演以及估计气溶胶和云的性质Efremenko等人。这种反演方法非常耗时,因为要重复调用模拟辐射率和雅可比矩阵的复杂辐射传输,以及后续比较大的矩阵求逆。这些考虑推动了遥感实时应用的替代反演技术的发展。
大多数机器学习算法没有明确考虑优化问题。相反,他们学习并对感兴趣的参数进行预测。在这种背景下,我们开发了一种新型的算法来解决反问题,称为全物理反学习机。从概念上讲,FP-ILM包括一个训练阶段和一个操作阶段。
在训练阶段,利用辐射传输模型RTM,表示“全物理”部分生成的合成数据获得反演算子,在操作阶段,反演算子应用于实际测量。FP-ILM相对于经典优化方法的主要优势在于,涉及复杂RT建模的耗时训练阶段是离线进行的;逆算子本身是鲁棒的并且计算简单。
是用于估算羽流高度值的FP-ILM的。在训练阶段,使用全物理正演模型计算训练数据集,在我们的例子中,该模型是RTM。RTM计算模拟的辐射率,作为以下函数输入参数:二氧化硫总柱密度和烟羽高度、地表反照率、地表高度、臭氧总列、太阳天顶角、观察天顶角和相对方位角——参见第三节详情请见。
FP-ILM具有以下属性:样本数量和输入数据的网格由智能采样技术优化确定,从而确保给定样本数量的输入和输出空间的最佳覆盖范围(洛约拉、佩德格纳纳和吉梅诺·加西亚。为了捕捉模拟数据的基本特征并避免“过度维数”,使用适当的降维技术压缩模拟的光谱数据。
通过机器学习获取降维光谱模拟和羽流高度之间的映射。全物理逆学习机算法示意图。智能采样方法为输入数据提供了最佳的数值网格。然后,正演模型计算一组模拟输入数据的模拟光谱。
使用线性例如,主成分分析、独立成分分析或非线性映射将高维光谱数据转换到更少维度的空间。应用机器学习算法来捕获压缩的光谱信息和待估计的参数之间的相关性。得到的逆算子然后用于处理测量结果。
FP-ILMs的设计围绕着两个难题。首先是方差和偏倚之间的权衡):减少偏差的努力可能导致更高的方差,反之亦然。第二个难题是准确性和稳定性之间的权衡:当逆模型更多地受随机误差和噪声影响,而不是受测量和状态向量元素之间的任何潜在关系影响时,存在过拟合的风险。
实际上,将几种技术结合起来利用它们的最佳特性是有利的。例如,在洛约拉使用非线性PCA完成维数减少,伴随着用于解决逆问题的多神经网络方法。在布莱克威尔和陈,线性回归方案用于预测偏差,而神经网络用于减少方差。本文提出的检索算法最初是由Loyola进一步发展并应用于烟羽高度反演问题。
基于的输入数据集n输入变量的特征在于一组离散的样本。输入采样n-维空间k每个维度的值需要样本总数;对于高维数据,这个数字可能非常大。显然,的价值k应该尽可能小,而不影响数据集的正确表示。
从概念上讲,最简单的采样技术是基于沿超立方体每个轴的统一网格。更高级的算法依赖于具有均匀分布点的准随机序列如同。继Weyl,使用所谓的序列差异来测量那些序列的一致性。
不涉及细节,我们在这里只是注意到,如果属于子区间的点的数量与子区间的度量成比例。低差异值表示点在超立方体上分布良好。对于低数量的采样点和高维数,使用均匀网格采样的覆盖非常差。
洛约拉、佩德格纳纳和吉梅诺·加西亚开发的智能取样方法用于以最小数量的样本最优地覆盖输入和输出空间。这些方法是基于一些特殊的序列,这些序列具有随机变量的一些特性。
在洛约拉、佩德格纳纳和吉梅诺加西亚,在高维回归问题的背景下分析了不同的采样方法。
已经证明哈尔顿系列在处理高维数据方面更胜一筹,同时具有合理的计算时间。所需的样本点数量s是迭代估计的。智能采样和增量功能学习程序包括以下步骤:
对于感兴趣的光谱范围,310-330纳米,所以2和臭氧(O3)是两种主要的微量气体吸收剂。这个范围包括O3哈特利-哈金斯吸收带,而有很强的SO2吸收特征朝向该窗口的下端。等等。
«——【·结论·】——»
在本文中,我们描述了快速准确地反演大气气溶胶的FP-ILM模型2烟羽高度。FP-ILM有两个阶段——培训和运营。培训阶段包括:用于生成模拟光谱的训练数据集的智能采样;一套以最佳方式涵盖反转功能,同时最大限度地减少对RTM的调用次数;
降维以减轻仪器噪声的影响并提高光谱辐射数据集反演算法的速度和稳定性,用于获得反演算子的线性和非线性回归模型。智能采样减少了充分再现训练数据集中任何统计相关性所需的样本总数。
为了减少回归模型中预测因子的数量并提高算法的稳定性,对光谱辐射亮度数据集应用了降维方法。我们考虑了主成分回归和PLSR。与PCR不同,PLSR计算一组新的基础向量,以最大化输入和输出数据集之间的相关性。
在我们的数值测试中,PLSR模型在准确性方面似乎比PCR模型更有效,尽管它们之间的差异并不显著。回归分析分两步进行。首先,应用线性回归模型来获取光谱辐射度和烟羽高度信息之间的一般相关性。
我们通过使用神经网络来解决非线性依赖性。一个重要的方面是,作为通过使用PLSR提取“线性”相关性的结果,可以简化神经网络结构,从而显著减少训练时间。对于我们的应用,我们表明这种混合方法优于单独的线性或非线性回归。
关于计算时间,我们注意到训练阶段是离线执行的,而产生的逆算子在计算上是简单的。FP-ILM已经应用于两次火山爆发的GOME-2测量。结果与文献一致。然而,对于FP-ILM,仍然需要做额外的工作来适当地描述羽流高度反演和灵敏度中的误差。
到目前为止还没有考虑到与气溶胶有关的误差。注意,气溶胶对光谱的影响是平滑的,类似于地面反照率的影响,与SO相反2基于吸收的特征。由此可见,由气溶胶引起的光谱辐射度的变化可以通过地表反照率的变化得到补偿。
考虑到这一点,为烟羽高度反演设计的FP-ILM应该对差分吸收信号比与气溶胶有关的连续谱信号更敏感。预计第二份文件将跟进本文件中提出的一些问题。特别是,我们计划将FP-ILM应用于其他传感器和更多的火山爆发
将评估温度-压力剖面以及与光谱校准和狭缝函数相关的误差对检索到的羽流高度的影响。
«——【·参考文献·】——»
南埃弗雷缅科,《不变量嵌入法和辐射传输方程代码在表面态分析中的应用》,光散射评论,1988年。
卢本琴科,《确定弹性峰电子能谱辐射传输方程的小角度近似解的适用性边界》,俄罗斯科学院通报:物理学,2012年。
巴蒂亚, 《算法理论基线文件》,TOMS V8臭氧总量算法,2003年。
布莱克威尔,《大气遥感中的神经网络》剑桥出版社,2009年。
博德海因,《瑞利光学深度计算》, 大气和海洋技术杂志,1999年。