智能遥感大模型研究进展与发展方向
燕琴, 顾海燕, 杨懿, 李海涛, 沈恒通, 刘世琦

Research progress and trend of intelligent remote sensing large model
Qin YAN, Haiyan GU, Yi YANG, Haitao LI, Hengtong SHEN, Shiqi LIU
表2 多模态数据集
Tab.2 Multimodal dataset
数据集名称发布年份数据类型数据量描述
MillionAID[19]2021Google Earth影像百万张实例一个用于遥感场景分类的大型基准数据集,包含了广泛的语义类别,具有空间分辨率高、规模大、分布全球等优势
Satlas[20]2022中分辨率Sentinel-2影像、高分辨率NAIP影像2.9亿个标签覆盖场景广、数据规模大
RSICap[21]2023遥感图像、文本描述数据2585个高质量字幕用于遥感图像精细描述的数据集,包括图像场景描述,(如住宅区、机场或农田)以及对象信息(如颜色、形状、数量、绝对位置等)
RSIEval[22]2023人工注释的字幕-视觉问答31.8万个图像指令对图像-问答三元组,可以全面评估VLMs在遥感环境下的性能
SpaceNet[23]2018WorldView-2/3等光学影像1500万张影像全球第一个公开发布的高分辨率大型遥感数据集,用于目标检测、语义分割和道路网络映射等任务
SkyScript[24]2023遥感图像-文本描述数据260万张图像文本对一个用于遥感的大型且语义多样化的图像文本数据集,通过GEE和OpenStreetMap获取,全球覆盖,语义信息跨越对象类别、子类别和详细属性
fMoW[25]2018多种传感器的时间序列影像、多光谱影像70万张影像一个用于多种遥感任务的大型数据集,旨在激发机器学习模型的开发,使模型能够从卫星图像的时间序列中预测建筑物的功能用途和土地利用
SkySense[26]2024高分辨率WorldView-3/4影像,中分辨率Sentinel-1/2影像2150万个训练样本涵盖了不同分辨率、光谱和成像机制的各种情景,每个样本包括具有纹理细节的静态HSROI,包含时态和多光谱数据的TMsI,在云覆盖下提供散射极化的标准校准TSARI,以及用于地理上下文建模的元数据
BigEarthNet-MM[27]2021Sentinel SAR和多光谱数据59万个多模态样本支持多模态多标签遥感图像检索和分类研究
SEN12MS[28]2019Sentinel-1/2,MODIS传感器的SAR和多光谱数据18万个多模态样本由全球42个城市群的数据组成,能够应用于最先进的机器学习方法,以应对城市化和气候变化等全球挑战
RingMo[29]2023Sentinel-1/2,Google Earth,WorldView,高分二号等多种光学遥感影像200万张影像数据集图像数量众多、分辨率变化范围大,更适合遥感领域下游任务