Kubernetes监控用户指南



Kubernetes-概述

Kubernetes(或k8s)是一个开源容器orchestration系统,用于跨主机集群自动部署,扩展和管理应用程序容器。Kubernetes集群可以跨越公共,私有或混合云中的主机。K8sorchestration允许用户跨多个容器构建应用程序服务,跨集群调度这些容器,扩展这些容器,并随时间管理这些容器的健康状况。

监控Kubernetes集群-监控内容

Applications Manager使管理员可以调整监控策略,以解决分布式Kubernetes环境中引入的新基础结构层(采用容器和容器orchestration时)的问题。

  • 自动发现集群中Kubernetes节点,名称空间,部署,副本集,Pod和容器中对象之间的零件并映射关系。
  • 跟踪集群的容量和资源利用率,并能够深入研究集群的特定部分。
  • 确定集群中是否有足够的节点,并且对现有节点的资源分配对于已部署的应用程序而言已足够。
  • 确保集群上的所有节点都健康状况良好-监控Kubernetes节点(工作人员和主节点)的CPU和内存。
  • 确保部署中的所有所需Pod正在运行,而不是在重新启动循环中。
  • 为容器重新启动设置告警,以识别容器或其主机上影响其应用程序性能的问题。
  • 监控集群中运行的Kubernetes托管应用程序的性能异常值,并跟踪任何单个错误。
  • 查看Kubernetes主节点和节点组件的状态-API服务器,Etcd键/值存储区,调度程序和控制器。
  • 监控Pod可能消耗的Persistent Volume存储以及将Pod专有使用权授予存储的Persistent Volume Claim。

添加一个新的Kubernetes监视器

设立Kubernetes监控先决条件:kubectl应安装在安装Kubernetes在机器上。

请按照以下步骤创建一个新的Kubernetes监视器:

  1. 点击 新建监视器 链接。 
  2.  虚拟化 类别下选择 Kubernetes 
  3. 指定 Kubernetes服务器的 显示名称
  4. 输入运行Kubernetes的服务器的集群主机名/ IP地址。 
  5. 输入凭证详细信息(例如用于身份验证的用户名密码),或在启用从凭证列表中选择选项后,从凭证管理列表中选择所需的凭证。
  6. 选中此框以启用 公共密钥身份验证 (仅支持SSH2)和SSH身份验证的SSH密钥。
  7. 指定 命令提示符值,它是命令提示符中的最后一个字符。默认值为$,可能的值为>,#等。
  8. 输入 SSH端口。 使用的默认SSH端口为22。
  9. 以分钟为单位指定 轮询间隔 
  10.  从组合框(可选)中选择要将Kubernetes与之关联的 业务组。您可以选择多个组来关联您的监视器。
  11. 点击 添加监视器。这将从网络中发现Kubernetes并开始对其进行监控。

监控参数

通过点击监视器选项卡,转到监视器类别视图。点击Virtualization表下的Kubernetes。显示的是Kubernetes批量配置视图,分为三个选项卡:

  • 可用性标签提供了过去24小时或30天的可用性历史记录。
  • 性能选项卡提供了过去24小时或30天的健康状况和事件。
  • 列表视图使您可以执行 批量管理配置

从列表中点击监视器后,将转到Kubernetes监视器仪表板。它有五个标签-

概览

参数描述
命名空间的详细信息
Namespace Name命名空间名称
Resource Version命名空间的版本号
Namespace Availability命名空间的可用性
Namespace CreatedTime命名空间的创建时间
PODS
Used Pods Count使用的pod数量
Maximum Pods Count最大Pod数
Used Pods Count per Node单个节点中的pod数
集群使用细节
Average Cluster CPU Usage集群使用的平均CPU
Average Cluster Memory Usage集群使用的平均内存
节点
Master Node Count主节点数
Worker Node Count工作节点数
集群详细信息包含有关集群的详细信息
组件细节包含有关组件的详细信息

节点

参数描述
节点存储详细信息
Node Memory LimitGiB中节点内存的最大限制
Node Memory Requests内存请求数
节点CPU细节
Node CPU LimitCPU最大限制
Node CPU RequestCPU请求数
节点内存和CPU的详细信息
Name节点名称
Allocatable Memory(GiB)可以在GiB中进行调度的节点的CPU资源
Memory Limit(%)可以使用的最大内存资源限制
Memory Request(%)内存请求数(%)
Allocatable CPU Processor Count可用的CPU进程数
CPU Limit(%)可以使用的最大CPU资源限制
CPU Request(%)CPU请求数(%)
NODE POD的详细信息
NamePod名称
Pod Usage Details可用和已拆分的可用荚的可用pod总数。
Kube-system Pod CountKube状态pod的数量
Non-Kube-system Pod Count非Kube状态pod的数量
Image Count节点中的图像数
Used Pod CountKubernetes中存在的Pod总数
Allocatable Pod Count可用的Pod数
节点细节
Name节点名称
OSImageOSImage名称
OS容器所在的操作系统名称
Architecture架构细节
Type节点类型
Kubelet Version使用的Kubelet版本
Allocatable Ephemeral Storage(GiB)GiB中可用的临时内存大小
Created Time创建节点的时间

Pods

参数描述
POD细节
Pod NamePod名称
Pod NamespacePod所在的命名空间
Pod Node NamePod节点的名称
Pod ApplicationPod应用程序的名称。
Pod TypePod类型。
Pod created创建Pod的方式。
Pod Running StatusPod的状态。
Pod Start TimePod的开始时间。
Pod Created TimePod创建的时间。
POD内存详细信息
Pods Memory Limit最大内存限制。
Pods Memory Request内存请求数。
POD内存和CPU的详细信息
Pod Namepod的名称。
Number of Containers容器运行的容器数。
Pod CPU Limit(%)可以使用的最大CPU资源限制。
Pod CPU Request (%)Pod的CPU请求数,以%为单位。
Pod Memory Limit(%)可以使用的最大内存资源限制。
Pod Memory Request(%)请求的内存数量,以%为单位。
Pod created创建pod的方式。
Pod Persistent Volumes Claimpod可以通过其访问永久卷的声明的名称。
CONTAINER 详情
Container Name容器名称。
Container Image容器镜像的名称。
Container Pod Name容器的名称。
Container Restart Count容器重新启动的次数。
Container Running Status容器的状态。
Container Start Time容器的开始时间。

服务

参数描述
服务细节
Services Name服务名称。
Services Namespace服务所在的命名空间的名称。
Services Application服务应用程序的名称。
Service Type服务类型。
Service Protocol服务协议名称。
Service Target Port与服务连接的端口名称。
Service Created Time服务的创建时间。
部署细节
Deployment Name部署名称。
Deployment Namespace部署所在的命名空间。
Deployment Replica Count部署中的副本数。
Deployment Available Replica Count部署中可用副本的数量。
Deployment Availability部署的可用性。

持久卷

参数描述
持久的体积细节
PV Name持久卷的名称。
PV Status持久卷的状态。
PV Claim持续批量索赔的名称。
PV Access Mode您可以通过其访问持久卷的模式。
PV Storage Class持久卷存储类的名称。
PV Capacity(GiB)GiB中持久卷的容量。
PV Created Time持久卷的创建时间。
持久性卷详细信息
PVC Name持续批量索赔的名称。
PVC Namespace声明所在的名称空间的名称。
PVC Status持续批量索赔的状态。
PVC Volume持久性数量声明的数量。
PV Access Mode您可以通过其访问持久卷的模式。
PV Storage Class持久卷存储类的名称。
PVC Requests(GiB)GiB中的持续批量声明请求数。
PVC Created Time持久体积声明的创建时间。

受到世界各地客户的喜爱

"具有广泛监控功能的Standout工具"

它允许我们跟踪关键指标,如响应时间、资源利用率、错误率和交易性能。实时监控告警会及时通知我们任何问题或异常,使我们能够立即采取行动。

审稿人角色:研究与开发

我喜欢Applications Manager,因为它可以帮助我们检测服务器和SQL数据库中存在的问题。
卡洛斯·里韦罗

Lexmark技术支持经理

受到全球6000多家企业的信任

我们的客户