智能遥感大模型研究进展与发展方向
燕琴, 顾海燕, 杨懿, 李海涛, 沈恒通, 刘世琦

Research progress and trend of intelligent remote sensing large model
Qin YAN, Haiyan GU, Yi YANG, Haitao LI, Hengtong SHEN, Shiqi LIU
表3 典型遥感大模型
Tab.3 Typical remote sensing large models
遥感大模型代表模型特点
遥感视觉大模型RS-BYOL[41]、SeCo[42]、SatMAE[43]、RingMo、RVSA[44]、RSP[45]、Scale-MAE[46]、SpectralGPT[11]、DINO-MC[47]使用无标签光学影像作为训练数据,通过自监督学习预训练具有丰富语义的视觉特征,但需要微调才能实际应用
遥感生成大模型DiffusionSat[48]使用自监督学习,可以生成逼真的遥感影像,可以解决多种生成任务
遥感多模态大模型视觉+语言紫东太初、MCRN[49]、RemoteCLIP[40]、GeoChat等将文本与遥感视觉特征对齐,具有无缝下游应用的潜力,但数据收集需要文本与遥感图像对应,成本较高
视觉+位置CSP[50]、GeoCLIP[51]、SatCLIP[52]可从公开可用的遥感卫星图像结合其附带的位置信息中学习特征表示
视觉+音频SoundingEarth[53]同时利用视觉和听觉理解应用场景