1 引言
1.1 研究背景与行业需求
航天领域具有数据多模多态、任务高度复杂、运行环境极端严酷的显著特征。以Transformer架构为核心的通用大模型,虽能支撑通用知识问答、基础图像处理等航天信息通用任务,但在航天专业业务场景中,普遍存在专业知识覆盖不足、垂直任务适配性差、逻辑推理与自主决策能力薄弱等问题,无法满足航天任务精细化、定制化的应用需求。在此背景下,构建适配航天领域特性的垂直大模型,成为推动航天任务智能化升级的必然趋势。
航天信息知天大模型的研发目标,是实现通用大模型能力与航天垂直任务专业数据、专业模型的深度融合,将传统航天信息业务流程转化为大模型驱动的智能化系统,打通航天数据获取、处理、分析、决策、执行的全链路,为各类复杂航天任务提供智能化技术支撑。
1.2 国内外研究现状
在大模型理论研究层面,通用模型以Transformer架构为核心,混合专家系统(MoE)与神经符号逻辑融合成为重要突破方向;针对航天数据稀缺问题,合成数据生成与自监督学习成为提升模型泛化能力的关键路径。国外研究中,NASA提出物理引导神经网络,将物理规律嵌入模型训练以提升极端环境下的预测可靠性;ESA推动符号推理与神经模型融合,增强航天任务决策的可解释性;MIT林肯实验室提出联邦学习框架下的多卫星协同建模方法,实现数据隐私保护与模型协同进化的平衡。
在技术研发层面,国内航天领域已涌现出中科天塔“华山”大模型、中科院RingMo-Lite遥感大模型等成果,武汉大学、西安电子科技大学等高校也相继推出航天领域视觉大模型;国外方面,SpaceX基于GPT-4架构实现Starlink低轨卫星网络动态路由优化,蓝色起源采用MoE架构开发火箭回收任务规划引擎,欧洲空客防务公司的SCARLET平台已在Pléiades Neo星座完成卫星影像实时异常检测在轨验证。
在应用落地层面,国内航天科技集团启动“智擎计划”,推动大模型在卫星数据处理与任务规划中的应用;国外已将大模型应用从基础数据处理延伸至航天器自主任务执行,NASA、ESA、谷歌DeepMind等机构分别在地球观测数据处理、卫星指令生成、地表变化分析等场景实现了技术落地。
2 航天信息知天大模型整体架构设计
航天信息知天大模型采用分层解耦的架构设计,自下而上分为算力与数据底座、通用大模型层(L0)、航天信息行业大模型层(L1)、航天信息垂直大模型层(L2)、航天信息智能体层(L3)五个层级,各层级能力逐级聚焦、功能互补,形成了“通用能力-行业适配-垂直优化-自主执行”的完整能力体系。

2.1 基础底座
底座是模型训练与运行的核心支撑,由CPU/GPU集群、国产芯片构成的高性能算力集群,以及航天领域高质量数据集组成,为上层模型提供算力保障与数据基础。
2.2 通用大模型层(L0)
该层是模型泛化能力的核心载体,在大规模无标注数据上完成预训练,包含自然语言大模型、视觉大模型、多模态大模型、预测大模型四大基础模型,同时配套军事大模型,具备军语理解增强、战场环境模态理解、长链思维推理等核心能力,可在少量微调或无微调的情况下完成多场景基础任务。
2.3 航天信息行业大模型层(L1)
该层是通用能力向航天行业适配的关键环节,基于航天业务相关数据完成二次预训练,涵盖遥感、导航、测绘、通信、网电、感知、环境七大细分行业大模型。通过航天信息知识库构建技术,以检索增强生成(RAG)方式补充大模型的专业知识局限,显著提升航天各业务领域的处理性能与结果准确度。
2.4 航天信息垂直大模型层(L2)
该层针对航天特定任务与场景做深度优化,通过航天领域强化学习与奖励工程、航天任务型专家混合架构与稀疏激活、面向天基算力的知识蒸馏与模型压缩等核心技术,重点提升卫星在轨目标解译、智能制图、态势评估、空间天气分析等垂直任务的处理效果,具备强自主适应能力、星上实时处理能力与深度语义推理能力。
2.5 航天信息智能体层(L3)
该层是模型能力的最终落地载体,具备自主感知、决策与行动能力,通过雷光电星多模态数据融合、航天信息知识图谱动态构建、大模型驱动的智能交互等技术,实现星座自主导航与控制、多任务自主推理与决策、航天器故障诊断与修复、空间环境感知、目标行为预测五大核心功能,完成自然化人机交互与自主化任务闭环。
3 核心关键技术归纳
航天信息知天大模型围绕航天领域的场景特性与任务需求,构建了7项核心关键技术,形成了适配航天场景的完整技术体系,具体如下:
3.1 航天信息知识库构建技术
该技术是解决大模型专业知识局限性的核心手段,采用模块化架构,通过多模态数据接入清洗、语义向量检索模块设计、知识增强生成模块构建三大核心步骤,搭建航天业务专用知识库。同时引入GraphRAG技术,以图结构组织航天知识实体与关联关系,支持多跳图检索与深度逻辑推理,实现跨模态知识的高效检索与精准调用,显著提升航天领域复杂决策的精准度与系统响应效率。
3.2 航天领域强化学习与奖励工程技术
针对航天任务决策环境高度不确定、多步决策耦合性强的特点,通过强化学习技术提升模型对复杂动态未知环境的自主适应能力。训练阶段适配策略梯度算法、近端策略优化、基于模型的强化学习、分层强化学习四类方法,分别适配火箭姿态连续控制、航天器轨迹优化、轨道转移、火星巡视器路径规划等不同场景;微调阶段采用基于模型的微调与分层微调策略,适配火箭发动机参数调整、在轨维护任务执行等场景。同时配套逆强化学习、分层奖励、基于规则的奖励、多目标奖励融合四类奖励工程方法,实现模型性能优化与专家偏好对齐。
3.3 航天任务型专家混合架构与稀疏激活技术
为解决航天多任务并行处理中模型精度与实时性难以兼顾的问题,采用层叠式MoE架构与专家共享机制,将轨道控制、故障诊断、遥感解译等复杂任务分解为多个子任务,由特定领域的专家模型分别处理,结合动态路由算法减少模型冗余。配套稀疏激活技术,可根据任务需求动态激活最相关的专家模型,大幅减少计算资源浪费;同时通过轻量级通信协议实现专家模型间的高效协同,适配深空低带宽、高延迟的通信环境,提升复杂航天任务的整体执行效率。
3.4 面向天基算力的知识蒸馏与模型压缩技术
针对星载计算资源受限与复杂任务需求之间的核心矛盾,通过知识蒸馏技术,将地面大型预训练教师模型的专业知识迁移至轻量化学生模型,在保证任务性能的同时大幅降低计算复杂度。同时通过模型剪枝去除冗余参数、简化模型结构,通过模型量化将高精度浮点数转换为低精度定点数,进一步减少计算与存储开销,使复杂的遥感影像分析、环境感知、路径规划模型能够在低功耗星载处理器上高效运行。
3.5 雷光电星多模态数据融合技术
该技术整合卫星、地面站等平台获取的全色、多光谱、激光雷达、SAR、电磁等异构数据,通过深度学习模型将不同模态数据映射至统一语义空间,实现跨模态特征对齐。融合策略上,引入多尺度特征提取机制捕捉局部细节与全局上下文信息,采用自适应权重分配方法动态评估各模态信息贡献度,在保留互补信息的同时抑制数据冗余,有效解决了航天数据的异质性、冗余性问题,推动航天系统从“被动躲避风险”向“主动预测并利用环境”转变。
3.6 航天信息知识图谱动态构建技术
该技术针对航天任务需求,将测绘、遥感、导航等多源知识结构化,形成可推理、可扩展的动态知识网络。构建流程分为四个核心环节:一是动态感知与采集卫星遥测、轨道参数、任务报告等多源异构数据;二是通过实时流处理、小样本学习、跨模态关系抽取等技术完成知识抽取与增强;三是采用时序图数据库实现图谱的动态构建与演化,支持知识版本迭代、本体库自动扩展与冲突消解;四是基于图神经网络实现实时推理与交互式可视化,支撑卫星故障链预测、空间目标态势分析等应用。
3.7 大模型驱动的智能交互技术
该技术是以大模型为核心的综合技术体系,由三大核心模块构成:动态规划模块基于大模型推理能力,将感知数据与任务目标匹配,生成多阶段执行方案与风险规避路径;语义解析模块实现航天专业术语的精准理解,将自然语言指令转化为可执行代码,支持多通道指令输入与实时状态反馈;跨系统协同模块通过API接口与气象卫星、地面测控站等外部系统联动,实现数据双向流动,最终完成航天器在轨高动态环境下的快速响应、多机协作与自主化任务闭环。
4 典型应用场景
4.1 航天遥感领域:遥感情报解译
在遥感应用中,模型首先融合可见光、高光谱、红外、SAR、激光雷达等多模态遥感数据,结合生成对抗网络与Stable Diffusion技术生成合成数据,构建了可支持十亿级参数模型训练的千万级样本集。通过超网络、Transformer编码器实现异质数据的特征对齐,引入多头跨补丁注意力机制捕捉跨模态长程依赖;同时集成Grounding DINO、CLIP等图文基础模型,采用MoE架构动态分配任务至对应专家网络,实现基于自然语言的遥感目标识别、地物分割、时序感知等多任务处理,大幅提升遥感情报解译的效率与泛化能力。
4.2 航天测绘领域:地理空间智能制图
模型构建了航天测绘智能体,通过模型上下文协议(MCP)调用国产地理信息系统模块,建立地理空间分析与产品制作的长思维链,实现制图任务的自主编排。智能体可自动完成制图需求理解、任务分解与规划,自主调用数据预处理、空间分析、制图渲染等组件,结合用户需求完成地图优化与成果输出,适配多比例尺指挥用图、专题图、地形图等多种制图场景,实现了地理空间智能制图的全流程自动化。
4.3 太空态势感知领域:空间目标异动检测
该应用属于L3层航天信息智能体的核心能力范畴,采用任务型MoE与稀疏激活技术提升检测效率。核心流程分为四个环节:一是收集目标轨道参数、部件动作特征,构建绕飞、变轨、逃逸等行为的特征知识库;二是基于动力学原理完成物理规律约束的轨道行为建模,增强对不完整观测数据的适应能力;三是整合时序运动特征与行为意图,完成多源特征融合;四是通过大模型完成深度分析与行为意图推断,实现空间目标异动的精准检测与识别,为太空态势感知提供智能化支撑。
5 核心创新点提炼
1. 分层架构创新:创新构建了“底座-通用层-行业层-垂直层-智能体层”五级分层架构,实现了通用大模型能力与航天专业任务的深度融合。分层解耦的设计既保留了通用大模型的泛化能力,又通过行业适配、垂直优化与智能体落地,逐级匹配航天细分场景的精细化需求,形成了航天领域全链路大模型架构体系,填补了通用能力与航天垂直任务适配的架构空白。
2. 技术体系创新:系统整合了7项航天领域专属关键技术,形成了从知识构建、模型训练、架构优化、轻量化部署,到多模态融合、知识推理、智能交互的完整技术闭环。各项技术均针对航天领域的场景特性与核心痛点设计,有效解决了航天专业知识局限、任务环境不确定、星载算力受限、多源数据异构等行业共性难题,构建了适配航天场景的大模型技术体系。
3. 任务适配创新:首创航天任务型专家混合架构与稀疏激活技术,针对轨道规划、姿态控制、故障诊断、遥感解译等不同航天任务设计专属专家模型,通过动态路由算法与稀疏激活机制,实现算力的按需分配与精准调用,在保证多任务处理精度的同时,大幅降低计算资源消耗,完美适配航天极端环境下低带宽、高延迟、算力受限的应用场景。
4. 全链路应用创新:构建了从底层模型训练到上层智能体落地的全链路应用体系,将传统航天信息“数据接收-地面处理-人工分析-指令下发”的串行流程,转化为大模型驱动的“感知-处理-决策-执行”自主闭环,在遥感情报解译、地理空间智能制图、空间目标异动检测等核心场景完成了应用验证,实现了航天业务流程的全流程智能化重构。
5. 星载部署创新:结合知识蒸馏与模型压缩技术,针对天基算力受限的核心痛点,实现了千亿级参数大模型的轻量化适配,解决了复杂深度学习模型在低功耗星载处理器上的部署难题,为卫星在轨实时处理、星座自主导航与控制、深空探测自主决策提供了可行的技术路径。
6 结论
本文针对通用大模型在航天专业领域的应用短板,提出了航天信息知天大模型的完整设计与应用方案。该模型通过五级分层架构实现了通用能力与航天专业需求的深度适配,7项核心关键技术系统性解决了航天领域大模型应用的共性难题,三大典型应用场景验证了模型的工程化落地能力。研究结果表明,航天信息知天大模型可有效提升航天任务的智能化水平,实现航天数据全链路的智能化处理与自主决策,在遥感测绘、太空态势感知等领域具备广泛的推广应用价值。未来随着算法的持续创新与算力的不断突破,该模型将进一步推动深空探测、太空资源开发等航天任务向更高自主性、更高智能化方向发展,为我国航天领域数智化转型提供核心技术支撑。
参考文献:航天信息知天大模型设计与应用,万刚等,航天工程大学学报


