跳到主要内容

核心功能

节点管理核心覆盖云区域、节点、环境、变量、组件库、控制器、采集配置、安装包八大管理能力,支撑多云资源与采集组件的统一管控。系统全面支持 Linux x86_64 / ARM64 双架构控制器与采集器,安装时自动探测目标节点架构并精准分发匹配的包,同时内置凭据脱敏与最小权限安全机制。

1. 云区域管理:节点资源的逻辑分组管控

云区域是节点资源的顶层逻辑分组单元,用于隔离不同场景(如生产/测试)的节点资源,实现资源的分域管理。

2da93494-ea86-4a0e-8963-1e6eb257f787.png

核心功能

  • 区域创建与信息展示:支持新建云区域,每个区域展示名称、简介及关联的通信组件(如stargazernats-executor);
  • 区域关联组件状态标识:区域卡片直观标注通信组件状态,快速感知区域的基础通信能力;
  • 环境未部署自动引导:当云区域基础环境未完成部署时,进入区域后默认落到「环境」页,优先完成区域通信能力建设。

2. 节点管理:控制器与组件的运行载体管控

节点是控制器、采集组件的运行实体(主机/容器),支持控制器部署、组件托管等全生命周期操作。

37264bce-56ed-488e-b5f6-f2b55af5cf47.png

核心功能

  • 控制器安装与状态监控:支持为节点批量安装 Linux(x86_64 / ARM64)/ Windows 控制器,列表展示节点的控制器运行状态、版本信息;
  • CPU 架构自动识别:远程安装时自动探测目标节点 CPU 架构(uname -m),并按 OS + 架构精准分发对应的 installer 与控制器包;节点 cpu_architecture 属性由 Sidecar 回调写入并持久化展示;
  • 托管组件全生命周期操作:支持对节点上的组件进行安装、启动、重启、停止等操作,失败任务可按节点重试;
  • 节点信息可视化:展示节点 IP、名称、所属组织、活跃状态、控制器状态、托管组件状态、安装方式、节点类型、CPU 架构与版本信息;
  • 节点配置批量下发:支持将采集配置批量绑定到节点,并对节点上的采集器执行批量运行操作;
  • 批量操作约束校验:批量采集器相关操作要求所选节点的操作系统与 CPU 架构保持一致;若所选节点 CPU 架构未知,系统将阻止操作并提示用户,而非静默返回模糊结果。

3. 环境管理:云区域通信的基础组件支撑

环境是云区域与平台通信的支撑组件集合(如stargazernats-executor),保障区域内节点与平台的通信连通性。

7ceec2e2-54cc-4ce1-8661-4d1f186917ef.png 14889dd0-f8c2-48cd-83ba-9afd01cb34e5.png

核心功能

  • 通信组件状态监控:实时展示stargazernats-executor等核心通信组件的运行状态(如“正常”);
  • 环境部署配置:支持通过容器方式生成部署脚本并复制执行,填写代理 IP/域名后快速完成环境搭建;
  • K8s 升级引导:环境页提供 K8s 入口与升级引导,用于承接集群环境的后续升级操作。

4. 变量管理:配置的动态统一管理

变量用于配置文件的动态值替换,实现多组件间的配置复用与统一管控,降低重复配置成本。

9cfeb728-3a1f-49d5-94eb-10797fd2e5c3.png 705b1a9e-0f67-4d0e-ac32-4fbe1b900119.png

核心功能

  • 变量生命周期操作:支持变量的新增、编辑、删除,列表展示变量名称、数值(敏感信息脱敏)、操作选项;
  • 动态配置替换:变量可在组件配置文件中引用,实现配置值的统一修改与批量生效,提升配置管理效率。

5. 组件库管理:多类型采集组件的集中管理

组件库是监控、日志、CMDB等采集组件的资源池,支持组件的新增、配置与版本管理,覆盖全栈采集场景。组件以「操作系统 + CPU 架构 + 名称」为唯一维度注册,支持为同一采集器分别维护 x86_64 与 ARM64 版本,运行时按节点实际架构精准匹配并回退通用定义。

f6f18374-818c-4ad7-89d2-cde80f5bca96.png d92167a3-0353-4db3-a03c-df0b04f088ab.png 32694e19-3728-4b74-a49f-24662f1b87e1.png 72c13ab6-aaf3-42a7-87f5-8077ea4f00c0.png

核心功能

  • 多类型组件分类管理
    • 监控类:包含Kafka Exporter、JVM JMX、Telegraf等性能采集组件;
    • 日志类:包含Filebeat、Auditbeat等日志采集组件;
    • CMDB类:包含Telegraf(适配CMDB数据采集)等组件;
  • Telegraf 内置网络流量采集能力:Telegraf 采集器模板内置 NetFlow(UDP 2055)与 sFlow(UDP 6343)流量采集支持,可接收网络设备上报的流量数据。采集到的流量记录按云区域与设备 IP 自动映射到对应资产实例,并标注实例标识与采样率,供监控侧形成设备流量指标,与监控系统的流量监控能力配套使用。
  • 多维标签筛选:支持基于应用标签、系统标签与 CPU 架构筛选组件,快速匹配目标部署场景;
  • 架构感知的采集操作:对节点执行采集器安装/启动/停止/重启等操作时,系统强制按所选节点的 CPU 架构过滤可用采集器,避免同名不同架构的采集器混淆;若所选节点架构未知则阻断操作并提示;
  • 组件全流程管理
    1. 新增组件:配置组件名称、适配操作系统(Linux/Windows)、CPU 架构、执行路径等基础信息,完成组件基础框架的创建;
    2. 组件包上传:点击目标组件后进入目标组件的「包管理」页面,点击「上传包」按钮,在弹出的上传窗口中,通过”点击上传”或”拖拽文件”方式导入组件包,确认后完成上传。

      node组件.png node上传组件包.png

    3. 版本管理:上传后的组件包会自动纳入版本管理体系,支持按操作系统、CPU 架构、对象与版本维度留存、切换与维护,实现组件的自定义扩展与迭代;
  • 组件标签标识:每个组件标注适配的系统、CPU 架构与组件类型,快速匹配部署场景。

6. 控制器管理:异构节点的自动化运维核心组件

控制器是节点侧的核心管理单元,负责节点与平台的通信、采集组件的生命周期管控,模块支持 Linux x86_64 / ARM64、Windows x86_64 三类控制器的专项管理,适配不同操作系统与 CPU 架构节点的运维需求。

7212156e-cff6-43ee-bac8-f7294f71ebf2.png

核心功能

  • 按系统与架构分类展示

    • 内置三类控制器:Linux(x86_64)控制器Linux(ARM64)控制器Windows(x86_64)控制器,卡片式展示并标注适配系统与 CPU 架构,清晰区分不同控制器资源,避免跨环境误用;
    • Linux 控制器展示架构标签(x86_64 / ARM64),Windows 当前仅支持 x86_64。
  • 架构自动探测与分流

    • 远程安装时先通过 uname -m(Linux)或系统命令(Windows)探测目标节点 CPU 架构,归一化后自动选择对应 installer 与控制器包,用户无需手动选择架构;
    • curl/bootstrap 安装时先在本机探测架构,再请求对应架构的 installer 与 session,一条安装命令适配所有架构。
  • 控制器组成与核心能力透明化

    • 各类控制器均由 SidecarNATS Executor 双组件组成:
      • Sidecar:负责节点侧的采集组件进程管控(启动/停止/重启);
      • NATS Executor:负责节点与平台的消息通信、任务指令接收与执行;
    • 核心能力覆盖:节点上各类采集器的生命周期管理、节点资源的自动化部署与动态协调、平台与节点的指令/数据传输。
  • 控制器全流程管理

    1. 新增控制器:配置控制器名称、适配操作系统(Linux/Windows)、CPU 架构、部署路径等基础信息,完成控制器基础框架的创建;
    2. 控制器包上传:点击目标控制器后进入该控制器的「包管理」页面,点击「上传包」按钮,在弹出的上传窗口中,通过”点击上传”或”拖拽文件”方式导入控制器包,确认后完成上传。

      controller组件.png controller上传组件包.png

    3. 版本管理:上传后的控制器包会自动纳入版本管理体系,支持按操作系统、CPU 架构、对象与版本维度留存、切换与维护,实现控制器的自定义扩展与迭代;
  • 安装运维闭环:支持远程安装、手动安装、卸载、失败重试、手动安装状态查询,并按任务查看节点级执行结果;分步骤状态树实时展示安装进度,环境校验失败时可秒级定位拦截点;

  • 场景化适配支撑

    • Linux x86_64 控制器:适配 x86_64 架构 Linux 服务器、虚拟机环境;
    • Linux ARM64 控制器:适配 ARM64 架构 Linux 服务器(国产服务器、云原生 ARM 节点等);
    • Windows 控制器:适配 Windows 服务器、终端等环境,支持手动安装交互介入。
  • 历史节点架构回填:对 cpu_architecture 为空的历史节点,可通过管理命令复用历史 SSH 凭据远程探测架构并批量回填,无凭据节点保留空值而非错误写入。

7. 采集配置管理:配置策略的定义与分发中枢

采集配置管理是实现批量化规则落地的核心能力,支持配置策略的主次拆分与节点下发,保障多节点采集组件按规执行并受控。

核心功能

  • 主配置与子配置分离机制
    • 主配置:定义组件运行的全局基础参数,单一组件在同一节点上对应一份生效主配置;
    • 子配置:针对局部任务(如指定路径的日志拉取规则、特定指标的过滤等)进行模块化定义。子配置遵循排序优先级执行,支持灵活的新增、修改、删除。
  • 配置多维度绑定与批量应用
    • 支持建立“配置 - 多个节点”或“节点 - 多个不同组件配置”灵活的绑定关系;
    • 能够自动化渲染最终配置格式(利用节点维度的变量),将修改后的配置文件实时应用并分发到对应的节点控制器(Sidecar),完成配置的无缝承接与更新;
  • 节点详情配置维护:支持在节点详情中查看托管程序运行状态、主配置与子配置,并执行配置应用、取消应用与批量删除等治理操作。

8. 安装包管理:版本与架构治理的统一入口

安装包管理是控制器与采集器发布治理的统一入口,用于维护不同操作系统、不同 CPU 架构下的可安装版本。控制器包在「操作系统 + CPU 架构 + 对象 + 版本」四维度唯一,支持为 Linux x86_64 与 Linux ARM64 分别维护独立的版本包。

核心功能

  • 安装包上传与校验:上传时自动识别版本号,并按命名规则校验包文件合法性;
  • 多维版本治理:支持按类型、对象、操作系统、CPU 架构、版本维度管理安装包;
  • 下载与清理:支持安装包下载与删除,删除时同步清理对应存储文件;
  • 重复上传拦截:同一操作系统、同一 CPU 架构、同一对象、同一版本的安装包不可重复上传;
  • 多架构发布校验:发布时可执行发布校验命令,核查各架构的 installer 与控制器包是否齐备,避免上线缺包导致对应架构节点安装失败。

9. 安全强化与体验优化

最新版本在节点运维的基础之上,着重加固了通信安全、凭据保护与权限治理,并大幅提升了异常排查时的可见性。

核心功能

  • 全链路通信加密 (TLS):节点(Sidecar/NATS-Executor)与平台核心服务之间全面启用 TLS 加密,保障跨公网/混合云场景下的通信数据安全。
  • 任务凭据脱敏存储:Ansible Executor 在写入任务存储前自动剥离 passwordprivate_key_contentansible_password 等敏感字段,凭据不落磁盘,task_query 接口不再暴露明文凭据。
  • 安装会话最小权限隔离:节点安装 Session 优先使用专用下载凭据(NATS_INSTALLER_USERNAME/PASSWORD),而非管理员全量凭据;无专用凭据时降级并记录警告,支持渐进式迁移。
  • 节点组织归属增量同步:Sidecar 回调时以增量 diff 方式同步节点所属组织(仅增删差量),避免全量替换引发的权限漂移,保障节点权限范围持续准确。
  • 探针配置安全注入:采集配置中的敏感密码以环境变量方式在运行时动态注入,无需硬编码明文到配置文件,守护凭据资产。
  • 超强兼容性远程部署:Linux 控制器向下兼容低版本 SSH 协议与”无 sudo 命令”环境;支持通过密钥凭据一键远程安装节点,适配边缘及老旧服务器场景。
  • Windows 手动安装支持:Windows 侧控制器全面支持手动安装交互介入,适配无法远程连接的 Windows 环境。
  • 部署过程可视化追踪:控制器安装执行日志通过分步骤状态树在前端实时展示,运维人员在环境校验失败时可秒级定位拦截点,告别”黑盒”部署。