跳到主要内容

监控中心

概述

Rainbond 监控中心插件为平台提供开箱即用的全栈可观测能力。启用后,平台管理员可在统一界面中查看集群资源总览、节点与 Pod 运行状态、工作负载健康度以及服务间流量拓扑,无需额外部署 Grafana 或 Prometheus 即可获得生产级的监控体验。

核心能力

集群监控概览

监控中心首页提供集群级全局视图,顶部汇总栏一目了然地展示关键指标:

  • 集群数CPU 核数团队数内存应用数磁盘实例数
  • 集群概览面板展示节点数、Pod 数、节点内存/CPU 请求平均占比、API Server 成功请求率
  • Namespace 维度总览表,按命名空间统计 Deployment、StatefulSet、DaemonSet、Job、Pod、Container、Service 等资源数量及异常状态
  • 底部 Top 10 排行:节点内存使用率、CPU 使用率、磁盘使用率、网络吞吐、Socket 连接数

集群监控概览

多维度监控面板

插件内置多个专项监控面板,覆盖从集群到容器的各个层级:

监控面板说明
集群概览集群级资源汇总与 Namespace 概览
团队监控按团队维度查看资源使用与应用状态
节点监控各节点 CPU、内存、磁盘、网络详情
节点性能节点级性能指标与趋势
Pod 监控Pod 级资源使用与运行状态
Pod 性能Pod 级性能指标(CPU、内存、网络 I/O)
守护进程监控DaemonSet 运行状态监控
工作负载监控Deployment / StatefulSet 副本状态与资源用量
无状态应用监控Deployment 类型应用的专项监控
有状态应用监控StatefulSet 类型应用的专项监控

流量分析

资源分析页面提供服务间流量拓扑可视化,以桑基图形式直观展示请求流向:

  • 左侧为各服务实例(组件端口),右侧依次聚合至应用、团队、集群
  • 可快速识别流量热点和异常链路
  • 支持全屏查看,适合大屏展示

流量分析

使用指南

启用插件

  1. 进入 平台管理 -> 插件中心,找到「监控中心」插件并启用。
  2. 启用后,平台管理页面左侧导航栏会出现「监控中心」入口。

查看集群监控

  1. 点击 监控中心,默认进入集群概览面板。
  2. 通过顶部标签页切换不同监控维度(团队监控、节点监控、Pod 监控等)。
  3. 面板右上角可调整时间范围和刷新频率。

查看流量分析

  1. 在监控中心页面切换到 资源分析 标签页。
  2. 选择「流量分析」,查看服务间的请求流向拓扑。
  3. 点击右上角 全屏 可放大查看。

获取企业版

开启企业级能力,免费试用 30 天,无需重新安装集群。体验 GPU 管理、安全审计等高级功能。