遥感对地观测能力的稳步提升为遥感基础大模型的涌现和发展奠定了数据基础。针对不同数据及任务类型,设计不同的深度网络骨架及优化方法必将浪费大量人力物力。为了解决上述问题,国内外研究学者转入遥感基础大模型研究,并提出了大量优秀统一模型。为提高遥感基础大模型的泛化性和可解释性,引入泛在的地学知识被认为是一项关键技术。目前,已有相关工作在遥感基础大模型的结构设计或预训练方法中挖掘或整合了地学知识,但尚无文献系统性阐述和总结地学知识引导的遥感基础大模型的研究现状。因此,本文首先对大规模遥感基础模型预训练数据集进行了归纳和总结,并分类回顾了遥感基础大模型的研究进展;然后,介绍了地学知识引导的遥感影像智能解译算法以及面向遥感基础大模型的地学知识挖掘与利用进展;最后,针对该领域仍然面临的挑战提出了几点未来研究展望,旨在为遥感基础大模型的未来研究提供探索方向参考。
面对大面积、高密度的制冰排管,平行度、翘曲度数据的提取存在检测精度低、数据覆盖不全面的问题。本文结合多棱镜靶球的三维激光采集方式,提出多站点云光束法全局配准方法,使用半径约束的随机抽样一致性球拟合法方法提取靶球中心,利用各测站点云原点绝对坐标、标靶中心相对坐标与标靶中心绝对坐标之间的坐标转换关系,采用光束法全局求解所有测站的位置与姿态参数,完成场馆点云的全局配准。试验采用国家速滑馆扫描数据进行验证。结果表明,点云匹配后内符合精度为2.6 mm,外符合精度为1.9 mm,相比于现有方法,本文方法取得了更高的采集精度。
通过智能化提升制图技术,让制图系统能全自动地完成地图设计与制作,一直是地图学界追求的目标,也一直是国际地图制图协会的前沿研究方向。从20世纪80年代开始,人工智能技术在地图学领域开始应用,逐步解决了部分工序的自动化问题,提高了地图制图的生产效率。然而,地图设计等关键环节的自动化水平仍然极低,无法满足信息时代的“定制化”“泛在化”制图需求。可喜的是,2023年以来,以GPT-4和Gemini等大语言模型(简称“大模型”)为代表的人工智能技术取得了突破,达到了“准通用人工智能”,表现出令人惊叹的语言理解力、推理能力和表达能力。基于此,本文探讨利用大模型来提升地图制图系统的智能水平,旨在建立新一代智能化制图理论与方法体系。首先,分析现有数字制图系统的瓶颈问题,指出建立新一代智能化制图技术的必要性;其次,分析大模型的性质与能力,论证建立新一代智能化制图技术的充分性;然后,进一步分析它们相结合的可能与方式,提出一个大模型时代的智能制图模式,并根据其根本性质与表征,将之称为情境化地图表达;最后,讨论情境化地图表达的关键技术问题,即自主觉知用图情境、自主设计制作地图及随境自主人机交互。
AI大模型以其泛化性、通用性、高精度等优势,成为计算机视觉、自然语言处理等AI应用的基石,本文在分析AI大模型发展历程、价值、挑战的基础上,首先从数据、模型、下游任务3个层面阐述了其研究进展,数据层面从单模态向多模态发展,模型层面从小模型向大模型发展,下游任务层面从单任务向多任务发展;其次,探讨了遥感大模型3个重点发展方向,即多模态遥感大模型、可解释遥感大模型、人类反馈强化学习;再次,实现了“无标签数据集构建-自监督模型学习-下游迁移应用”遥感大模型构建思路,初步开展了技术试验,验证了遥感大模型的显著优势;最后,进行了总结与展望,呼吁以应用任务为导向,将理论方法、工程技术、应用迭代进行结合,实现遥感大模型的低成本训练、高效快速推理、轻量化部署及工程化落地应用。
从20世纪60年代至今,GIS已有60余年的发展历程,其内涵经历了地理信息系统(GISystem)到地理信息科学(GIScience),再到地理信息服务(GIService)的转变。这一时期的GIS研究主要基于地图学的二维抽象表达逻辑(Map-based GIS),实现对现实世界的抽象分析与表达。然而,随着实景三维、数字孪生、城市信息模型等新技术及新需求的不断涌现,GIS原有的二维抽象逻辑面临多源异构时空大数据汇聚、处理、融合,复杂时空动态过程表征,以及潜在时空规律挖掘等的挑战。如何调整GIS的科学定位,以适应数字社会对空间对象表达与分析的多类型、多层次、多角色需求,成为当前GIS发展亟须考虑的重要问题。本文针对当前GIS发展面临的问题和转变,从方法论角度,深入分析Map-based GIS在空间表征、空间分析及综合应用上的瓶颈,进而立足于新时代GIS的发展需求,在融合Map-based GIS的逻辑思维基础上,从理论基础、管理模式、可视化形式、功能定位等视角,提出新时代从Map-based GIS到Space-oriented GIS的科学概念转化模型,创新GIS科学概念转化下的新型应用。本文期待能为新时期GIS的发展提供参考思路。
随着大数据时代的来临,多源大数据正在兴起,数据驱动研究范式与地理学日益融合。基于个体行为的地理空间大数据可提供对海量个体行为模式的观察,从而实现“由人及地”的社会感知,支持城市管理、交通、公共卫生等不同应用。本文从应用角度,以地理空间大数据为重点,梳理其支持的6种应用范式,按照层次从低到高依次为描述时空分布、识别异常对象、发现普适规律、揭示关联关系、预测未来趋势及优化空间决策。其中,第1个方向是对地理现象和地理要素时空特征的简单刻画;第2~4个方向则注重探寻时空分布特征背后的规律和机理;最后两项,则是在决策层面提供支持。继而,本文指出大数据应用中数据获取、分析方法和应用目标3方面的问题。
利用遥感影像提取道路对城市发展有重要意义。但是由于道路尺度多变、易被遮挡等因素,导致出现道路漏检、边缘不完整等问题。针对以上问题,本文提出了一种融合多尺度与边缘细节特征的道路提取网络(MeD-Net)。MeD-Net包括道路分割与边缘提取两部分。道路分割网络使用多尺度深层特征处理模块(MDFP),提取顾及全局与局部信息的多尺度特征,在卷积后使用组归一化优化模型训练;边缘提取网络利用细节引导融合算法提升深层边缘特征的细节信息,并利用注意力机制进行特征融合。为验证算法性能,本文利用Massachusetts道路数据集和青岛地区GF-2号道路数据集进行试验。试验表明,MeD-Net在两个数据集上交并比和F1值均取得最高精度,能够提取不同尺度道路和更完整地保持道路边缘。
实景三维和数字孪生已成为桥梁运维和管理的重要基础,然而面对桥梁的复杂几何结构,现有三维建模方法存在原始数据采集量大、建模效率低、模型细节缺失或变形等问题。对此,本文研究了一种基于3D高斯辐射场的桥梁实景三维重建方法。利用3D高斯函数对采集图像生成的稀疏点云构建高斯辐射场,并基于随机梯度下降对辐射场参数进行自适应优化,通过可微光栅渲染对三维模型进行实时可视化,从而实现高质量桥梁三维重建和渲染。试验探讨了不同图像分辨率,以及各项参数变化对桥梁建模的影响,并与传统方法作对比,为进一步针对桥梁的应用提供理论和技术支撑,推动桥梁复杂结构的高效、准确实景三维重建。
高精度卫星姿态控制是卫星重力数据预处理的重要环节。地球重力场和海洋环流探测(GOCE)卫星搭载的关键荷载星敏感器在低轨运行状态中,不可避免地受到空间环境的温度变化影响,导致星敏感器视轴夹角(IBA)存在2″~14″偏移,直接影响卫星姿态的精度。定量分析温度效应对卫星姿态的影响,精确测定卫星角速度,是卫星数据预处理流程中的重要环节,直接影响高精度重力梯度分量构建的精度。本文基于GOCE卫星任务的特性,构建了一种多星敏感器联合姿态四元数的温度效应改正方法,包括星敏感器之间的相对姿态偏移量构建为温度相关线性函数,结合星敏感器各轴的精度差异建立加权矩阵,依据最小二乘原理得到最优姿态四元数重建角速度。同时,在原始姿态数据的解算中,构建一种对数四元数Hermite超曲面内插方法进行数据优化处理。研究结果表明,改正后的星敏感器姿态四元数计算出的IBA与参考框架信息对比无明显偏移。且经过温度效应改正后,星敏感器各轴角速度噪声水平大幅下降了约两个量级,精度达到10-10 rad·s-1,显著提高了角速度重建的精度,各轴角速度精度保持良好一致性。基于本文方法计算得到的重力梯度迹的功率谱密度,在整个频域内有较为明显的改善。
我国北斗卫星导航系统已完成全球组网,开始向全球用户提供导航定位与授时服务。基于早期多系统兼容互操作的原则,目前市场主流的GNSS接收机均支持多系统的卫星信号接收。近年来,出于对自主性和安全性的考虑,一些部门和行业提出了使用单北斗满足高精度导航定位的需求。由于单北斗接收机在信号捕获时不能依赖其他系统信号的引导,其硬件及定位性能将可能发生改变,因此亟须对目前国产单北斗接收机的导航定位性能进行评估。本文选用M300 Pro单北斗接收机,开展了一系列测试评估试验,在对接收机的首次定位时间、信号质量和观测噪声等硬件性能进行分析的基础上,使用我国自主研发的北斗高精度数据处理软件平台(GSTAR)对静态站坐标解算、伪距单点定位、精密单点定位(PPP)、静态基线解算及实时动态定位(RTK)等定位性能进行了分析与讨论。试验结果表明,所选单北斗接收机冷启动时间低于40 s,平均观测数据完好比超过95%,伪距和载波相位观测噪声的标准差分别为0.051 7 m和0.003 4周,与国内外多GNSS系统接收机的硬件性能基本一致。利用所选单北斗接收机,可实现水平3.5 mm,高程9.9 mm的静态站坐标单天解精度;单历元伪距单点定位精度水平为2.208 m、高程为2.502 m;静态仿动态PPP固定解水平方向优于3 cm,高程优于5 cm,收敛时间优于27 min;20 km以内短基线天解重复性精度水平方向优于0.7 cm、高程方向优于1.8 cm;短基线RTK定位精度水平方向优于3 cm、高程方向优于5 cm。以上结果表明,所测国产单北斗接收机具备独立提供可靠的高精度定位服务的能力。
智慧城市建设中CORS位置服务的海量、隐私及高可靠性成为重要发展趋势。本文介绍了基于PPP-RTK技术体系的城市CORS增强定位服务,推导了城市CORS增强精密单点定位的公式,给出了城市CORS增强定位参数的可估形式及其在用户端的适用方法。结合广州CORS实时数据,验证了PPP-RTK服务的有效性。试验表明PPP-RTK用户端平面首历元即可收敛到厘米级,高程7个历元左右可收敛到厘米级,并且PPP-RTK增强定位参数SSR2OSR与短基线RTK性能大体相当,可支撑海量用户的监测需求。车载试验全程保持优于0.5 m车道级的三维精度,表明PPP-RTK定位能够满足多元化高可靠性定位。
针对建筑物变化检测中深度学习方法严重依赖大量高成本高难度的像素级标注样本进行模型训练的问题,本文提出一种基于图像级标注样本的高分辨率遥感建筑物弱监督变化检测方法MDF-LSR-Net。该方法首先提取双时相多尺度差异特征,并对多尺度差异特征进行渐进式融合,利用充分融合后的多层次多尺度差异特征来生成变化热力图;然后,利用低层融合差异特征的局部空间相似性来优化初始的变化热力图,进一步增强热力图中变化区域的完整性和准确性;最后,基于高质量的变化热力图训练最终的变化检测模型。在公开的建筑物变化检测数据集WHU和LEVIR上的多组试验结果表明,本文方法能够获取更加完整且准确的变化热力图,从而使得基于此训练的变化检测模型也取得更高的检测精度,其中最终的变化检测模型在WHU数据集上的IOU和F1值分别可达65%和79%以上。
陆地探测一号01组卫星(LT-1)的发射成功实现了我国L波段干涉SAR卫星“从无到有”的发展。LT-1卫星因空间避障等原因,部分空间基线较长;经过调轨后,空间基线长度控制在400 m以内。为了验证LT-1卫星数据的可用性及精度,本文以山西大同矿区为例,获取了2022年12月23日至2023年5月20日共25景LT-1条带模式影像数据,分别进行差分干涉测量短基线集时序分析(SBAS)技术和永久散射体(PS)技术数据处理。对时序InSAR和GPS站点在SAR卫星视线向上的形变监测结果进行对比分析,二者差异标准差分别为5.7 mm/a(SBAS-InSAR)和3.4 mm/a(PS-InSAR),时间序列均方根误差均小于5 mm,具有高度一致性。研究表明国产LT-1卫星具备高精度的形变监测能力,为国内地形测绘及形变监测提供了可靠的数据保障。
深度学习方法支持下的建筑物形状认知成为地图制图等领域研究的热点,利用深度学习的特征挖掘能力,可以提取形状的嵌入表示,支撑制图综合、空间查询等应用场景。本文以建筑物数据为例,构建了一种融合全局特征和图节点特征的建筑物形状分类的图谱卷积神经网络模型。首先,在建筑物加权图基础上分别以建筑物4个宏观形状特征、边界顶点的多阶局部和区域结构特征生成形状的融合描述;然后,利用图谱卷积神经网络提取多层次形状信息,通过融合不同层的图表示结果生成特征编码用于形状分类。试验结果表明,相较对比方法,本文方法能够更有效地区分不同建筑物的形状类别,且生成的特征编码具有良好的形状区分度。
陆探一号是我国首个采用差分干涉测量技术实现地表形变监测应用的合成孔径雷达(SAR)卫星星座,其01组双星分别于2022年1月26日和2022年2月27日成功发射并在轨运行。双星在轨后具有双基编队干涉和双星组网两种模式。在双星干涉成像模式下,利用双基InSAR条带模式获取全国高精度DEM;在双星组网成像模式下,双星同轨道间隔180°在轨稳定运行,重访周期由8 d下降至4 d,获取时序相干数据,具备高精度地表形变监测的能力。此外,陆探一号SAR系统具备多模式极化优势,可获取单航过多极化InSAR、混合极化SAR数据,可用于林业、国土资源调查及灾害监测等。本文对陆探一号SAR载荷的关键技术,包括相位同步、模糊抑制与系统定标等进行系统性阐述和分析。陆探一号SAR载荷实现的最高分辨率为3 m,最大幅宽可达400 km,同时干涉模式方位模糊度优于-20 dB,系统性能优良,本文通过地面测试和在轨实测数据对陆探一号多模式成像性能进行验证。
经过一年多的在轨测试,我国第一组民用差分干涉SAR卫星,L波段差分干涉SAR(也称“陆探一号”)经过了各系统联合调整,已经具备了较好的在轨运行条件。本文对部分在轨应用关键参数进行了测试分析。测试结果表明,卫星的长期平面定位精度优于3.9 m。河南省及江苏省的检校和验证数据表明,检校前、检校后以及平差后的DSM中误差分别优于13.2、6.3、2.9 m。卫星具有3种形变产品,即差分干涉技术获取的形变场、不计高程改正误差参数估计的初级多时相回归堆叠技术获取的低精度形变速率场,以及顾及高程改正误差参数估计的精细多时相回归技术获取的高精度形变速率场与形变累计序列。山西省大同市的形变场产品与同期水准对比表明,三者的中误差分别优于2.7 mm、8.6 mm/a、3.7 mm。同时本文进行了严格回归轨道控制半径的测试,测试结果表明,90%的值小于323 m。本文同时进行了相干性的评估,在不考虑时间相干性的前提下,整体相干性优于0.7。在轨测试结果表明,陆探一号卫星已经具备了较好的运行条件,可提供给各用户开展广泛应用。
遥感影像在获取过程中会经常受到条带噪声的污染,降低遥感影像的视觉效果,对影像解译和反演等处理产生不利影响。当前一些主流的基于变分的条带噪声去除方法,虽然可以去除条带噪声,但是往往也会导致影像细节信息的严重丢失。基于上述问题,本文提出了一种基于细节信息约束的遥感影像条带噪声去除模型(DISUTV)。在DISUTV模型中,将所提出的基于双边滤波器与正交子空间投影的细节信息分离算子与单向全变分正则化项、群组稀疏正则化项及单向全变分正则约束项进行了有效结合,并采用交替方向乘子法对其进行求解,用于从条带噪声影像中获取不含有细节信息的高精度条带噪声。利用模拟数据与真实数据对本文方法的条带噪声去除能力、细节信息保持能力及稳健性进行了验证并与现有前沿方法进行了比较。试验结果表明,本文方法在去除条带噪声的同时能更好地保留影像的细节信息,并且呈现出了较好的定性与定量结果。
利用卫星测量塔将水下定位转换为水上定位是国内外沉管隧道管节定位的主要方法。然而,测量塔变形和管节变形的耦合影响定位精度,且无法适应大水深安装对接。本文提出了一种水下主动光源编码合作靶标摄影测量管节对接定位方法,利用主动光源增加光学作用距离,抑制后向散射,靶标编码克服悬浮颗粒、浮游生物影响。结合透射光分离成像和折射率作为未知参数的测量平差,克服水体浑浊和折射率诱导的光学畸变对水下摄影测量的影响。通过在待沉管节对接端两侧顶部安装摄影测量系统,已沉管节对应位置安装合作靶标并贯通测量确定其在施工坐标系的位置和姿态,通过后方交会计算得到待沉管节在施工坐标系的位置,与需要沉放到的理论位置对比,生成待沉管节位姿调整信息辅助对接。深中通道和大连湾沉管隧道工程应用表明,管节对接线形精度达到2 cm和100 m,为未来大水深沉管隧道建设提供关键技术支撑。
大模型从深度学习和迁移学习技术发展而来,依靠大量的训练数据和庞大的参数容量产生规模效应,从而激发了模型的涌现能力,在众多下游任务中展现了强大的泛化性和适应性。以ChatGPT、SAM为代表的大模型标志着通用人工智能时代的到来,为地球空间信息处理的自动化与智能化提供了新的理论与技术。为了进一步探索大模型赋能泛摄影测量领域的方法与途径,本文回顾了摄影测量领域的基本问题和任务内涵,总结了深度学习方法在摄影测量智能处理中的研究成果,分析了面向特定任务的监督预训练方法的优势与局限;阐述了通用人工智能大模型的特点及研究进展,关注大模型在基础视觉任务中的场景泛化性以及三维表征方面的潜力;从训练数据、模型微调策略和异构多模态数据融合处理3个方面,探讨了大模型技术在摄影测量领域当前面临的挑战与发展趋势。
针对街景影像目标的智能化提取难题,本文提出了一种基于混合智能的街景影像知识提取方法(K-CAPSNet)。首先,在现有全景分割网络的基础上,同时关注街景影像的通道信息和空间信息,发展了一种联合注意力机制的全景分割网络,以提高目标分割精度;其次,将人们在生产、生活中形成的街景知识融入街景影像认知过程,借助先验知识设置目标标记阈值,对分割结果进行优化;然后,进一步根据街景影像先验知识验证街景目标之间的拓扑关系并利用深度信息进行空间关系知识挖掘;最后,采用语义模板对街景目标类型、数量及空间关系进行描述和表达。试验表明,相较于基线网络,本文方法在全景分割质量和识别质量方面都有明显提升,较好地实现了对街景影像知识的提取与表达。