科研动态——高分辨率影像引导的Transformer DEM超分辨率
时间:2026-05-12 浏览次数:

· 文章标题:High-Resolution Optical Satellite Image-Guided DEM Super-Resolution via Topographic-Aware Transformer
· 期刊名称:IEEE Transactions on Geoscience and Remote Sensing(IF = 8.6)
· 文章链接:https://ieeexplore.ieee.org/document/11455240
· 发表日期:2026.3.24
研究背景
数字高程模型(DEM)是许多地理空间应用(如水文建模、地貌分析和灾害管理)的基础数据,但广泛使用的全球DEM(如30m分辨率的SRTM)空间分辨率往往不足以进行精细尺度分析。尽管机载LiDAR等直接获取方法可以生成高分辨率(HR)DEM,但其高昂的成本和操作限制阻碍了其大范围覆盖。
基于深度学习的单幅图像超分辨率(SISR)技术为提升DEM分辨率提供了一种经济高效的替代方案。然而,传统插值算法通常会使地形过度平滑,而早期基于卷积神经网络(CNN)的模型由于卷积操作固有的局部感受野,在捕获大尺度地形结构所需的长距离空间依赖性方面存在根本限制。针对这一挑战,本研究提出了一种名为ATTSR(Attention-Transformer-guided Terrain Super-Resolution)的深度学习框架,旨在利用高分辨率光学卫星影像作为引导,实现高保真度的DEM超分辨率重建。

图1. 研究区范围
模型构建

图2. Enhanced Swin transformer框架
本研究设计的ATTSR框架不仅克服了CNN的局限性,还通过整合多模态信息来优化地形重建:
双分支Swin Transformer骨干网络:模型采用双分支架构,分别从低分辨率(LR)DEM和对应的高分辨率卫星图像中提取特征。与CNN不同,Swin Transformer通过分层移位窗口注意力机制((S)W-MSA),能够有效地对全局交互进行建模,从而捕获大尺度复杂地形结构的连续性。
地形感知注意力(TAA)模块:为了自适应地融合图像与DEM特征,研究人员提出了一种新颖的交叉注意力机制——TAA模块。该模块能够有选择地将引导图像中与地形相关的显著纹理特征注入到DEM重建分支中,在保持全局感受野的同时计算通道维度的注意力。

图3. 交叉注意力机制模块
地形协同损失函数:为确保优化过程不仅受高程精度引导,还能保证地貌的合理性,模型在协同损失函数中直接集成了地形梯度约束(包括高程MSE/MAE和坡度RMSE),以显式地保留山脊和山谷等地貌结构。
实验结果
(1)定量比较与误差分布分析
为了全面评估不同DEM超分辨率(SR)方法,本研究在三个具有不同地理特征的公开DEM数据集(奥地利、意大利和中国云南)上进行了测试。结果表明,无论是在30m至10m,还是在地形极其复杂区域的90m至30m超分辨率任务中,ATTSR在绝对高程(RMSE-Elevation)、坡度(RMSE-Slope)和坡向(RMSE-Aspect)三项指标上均显著优于Bicubic、SRCNN、TFASR和TTSR等现有方法。通过分析三个数据集的误差分布(图4),ATTSR的误差箱型图中位数最接近于零,且四分位距(IQR)最窄,这表明该模型不仅预测精度更高(偏差低),而且展现出极高的预测稳定性和鲁棒性(方差小)。

图4. 不同DEM SR模型在三个数据集上测试的误差分布比较
(2)高程特征保真度视觉评估
视觉层面的评估进一步印证了ATTSR在高程重建上的优势。如图8的高程重建对比与局部细节放大图所示,ATTSR在保留尖锐的山脊线和深切的河谷底部等精细地貌特征方面表现尤为出色。传统的插值方法容易产生过度平滑现象,而其他深度学习方法偶尔会出现系统性的高估或低估。相应的高程误差图表明,ATTSR的误差在空间上范围更小且相关性更低,通常表现为低幅度的近随机噪声,证明了其图像引导和地形感知优化机制的有效性。

图5. 不同模型生成的SR DEM结果的视觉比较与误差图
(3)坡度与坡向的准确性分析
地形梯度的准确重建对滑坡敏感性测绘或水文建模等实际应用至关重要。图6和图7分别展示了基于生成的SR DEM推导出的坡度和坡向图。得益于对高程数据结构和图像纹理线索的协同利用,ATTSR生成的坡度误差最小,尤其是在陡峭和梯度变化频繁的复杂地形中。同时,ATTSR推导出的坡向图最接近地面真实的HR DEM,有效避免了其他方法容易出现的平滑特征或定向伪影,最大程度地保留了地形坡面走向和整体地形纹理。

图6. 不同模型生成的SR DEM推导坡度图的视觉比较

图7. 不同模型生成的SR DEM推导坡向图的视觉比较
(4)图像引导特征选择机制的可视化分析
为深入探究监督引导特征选择在DEM重建中的作用,研究对引导图像和DEM特征块进行了可视化分析(图8)。可视化结果表明,引导图像特征与DEM特征在初始阶段存在纹理和边缘定义的差异。但在网络细化阶段引入特征融合后,监督选择机制成功提取了更加一致的结构模式,大幅降低了引导图像特征与DEM特征之间的域差异。此外,由于引入了交叉注意力机制,引导特征能够比原始DEM特征保留更多的高频细节,为精确的地形重建提供了关键的细节补充信息。

图8. DEM超分辨率中监督引导特征选择的视觉分析图
研究意义
本研究通过创新性地结合Swin Transformer和多模态图像引导,系统性地解决了DEM超分辨率任务中复杂地形依赖关系建模困难及多模态数据融合效率低下的问题。实验结果证明,ATTSR为影像引导的DEM超分辨率提供了一种先进的解决方案,推动了准确、大尺度高分辨率地形产品的生成能力,为水文、地貌及灾害分析等下游应用提供了坚实的数据保障。
作者介绍
第一作者:唐玉宾,中南林业科技大学2024级硕士研究生,研究方向为DEM超分辨率。
通讯作者:莫登奎,中南林业科技大学教授,博士生导师,智慧林业系主任。主要从事遥感图像精细化处理和智能解译研究,致力于解决森林资源遥感监测中的关键技术问题。主持国家自然科学基金项目3项(含面上项目2项、青年基金1项),主持“十四五”国家重点研发计划项目子课题1项,主持湖南省林业局杰出青年基金项目1项。与国家和湖南、广西等省林业主管或科研部门在森林精细化智能监测领域有多项合作。
合作作者:中南林业科技大学孙华教授、严恩萍副教授,中山大学熊育久教授、姜镓伟博士研究生。

