Google Cloud Platform监控


Google Cloud Platform-概述

Google Cloud是Google的内置云平台,可提供一系列云服务,包括计算,数据存储,数据分析和机器学习。Google Cloud Platform提供基础架构即服务,平台即服务和无服务器计算环境。

Google Cloud Platform监控-监控内容

Applications Manager的Google云平台监控工具将为您提供对Google云环境的每个组件的完全可见性,从而使您能够优化关键业务Google Cloud服务的性能。借助我们的根本原因分析功能,您可以轻松确定性能问题的根本原因,并快速对其进行故障排除。

我们的Google云监控功能将使您能够:

  • 毫不费力地监控您的Google Cloud Platform的计算元素。
  • 收集和监控关键指标,例如CPU使用率,磁盘I/O,内存使用率等。
  • 查看网络状态并了解性能趋势。

创建一个新的Google Cloud Platform监视器

监控Google Cloud指标的先决条件: 点击此处

使用REST API添加新的Google Cloud Platform监视器: 点击此处

请按照以下步骤创建新的Google Cloud Platform监视器:

  1. 点击新建监视器链接。在Cloud Apps类别下选择Google Cloud Platform
  2. 指定Google云应用程序的显示名称
  3. 输入您要监控的GCP服务
  4. 指定要监控的项目ID
  5. 指定OAuth Provider名称
  6. 如果选择高级设置选项,请输入要对已删除资源执行的操作。
  7. 如果要停止发现特定服务下的资源,请启用停止发现
  8. 指定 轮询间隔(以分钟为单位)。
  9. 如果要从管理服务器添加新监视器,请 选择被管服务器
  10. 从组合框中选择要与之关联的Google Cloud Platform监视器的业务组。您可以选择多个组来关联您的监视器。
  11. 点击添加监视器。这将发现Google Cloud并开始对其进行监控。

监控参数

通过点击监视器选项卡,转到监视器类别视图。点击云应用部分下的Google云平台。显示的是分布在三个标签中的Google Cloud批量配置视图:

  • 可用性标签提供了过去24小时或30天的可用性历史记录。
  • 性能选项卡提供了过去24小时或30天的健康状态和事件。
  • 列表视图使您可以执行 批量管理配置

从列表中点击监视器后,将转到Google Cloud仪表板。它包含3个标签-

概览

资源清单

参数 描述
Compute Engine Instances 可用的Compute Engine实例总数。
Cloud Storage Buckets 可用的存储桶总数。
Cloud Filestore Instances 可用的文件存储实例总数。
Kubernetes Engine Clusters 可用的Kubernetes Engine集群总数。

配额

参数 描述
Metric name 资源名称。
Limit 已分配的总配额。
Used 已使用的配额数量。
Available 可用配额数。
 
注意:配额指标已映射到性能轮询下。要更改轮询间隔,请转到管理→性能轮询→优化数据收集,然后为监视器类型选择Google Cloud Platform,为指标名称选择配额,并更改默认轮询状态。

计算

Kubernetes引擎

参数 描述
Name Kubernetes集群的名称。
Location Name Kubernetes集群的位置。
Status 集群的当前状态。
Endpoint 该集群的主端点的IP地址。
Current Node Count 集群中当前存在的节点总数。
User Pods Count 集群中当前存在的Pod总数。

通过点击集群名称,您将被重定向到 Google Kubernetes Engine监控仪表板。

计算引擎

参数 描述
Name Compute Engine实例的名称。
Instance ID Compute Engine实例的ID。
Status Compute Engine实例的状态。
Zone 实例可用的区域。
External IP Address 实例的外部IP地址。
OS Platform Compute Engine实例的操作系统。

通过点击实例名称,您将被重定向到 Google Compute Engine监控仪表板。

存储

云储存

参数 描述
Name Google Cloud实例中存储桶的名称。
Location Bucket 的位置。
Location Type bucket所在的位置类型。
Storage Class 存储桶的存储类型。
Bucket Size 存储桶的大小(以GB为单位)。
Number of Objects 存储桶中可用的对象总数。

通过点击存储桶名称,您将被重定向到 Google Cloud Storage监控仪表板。

云文件存储


参数 描述
Name Google Cloud实例中文件存储的名称。
Location Name 创建实例的区域的名称。
Fileshare Name 文件共享的名称。
Instance Tire 实例的服务层。
Total Storage 文件存储实例的总存储容量(以TB为单位)。
Storage Utilization Filestore实例中使用的存储量(百分比)。
Current IP Address 文件存储的当前IP地址。

通过点击文件存储名称,您将被重定向到 Google Cloud Filestore监控仪表板。

故障排除

1.身份验证失败。请求包含无效的身份验证凭证。

  • 在AppManager中,转到管理→OAuth提供商,然后检查GCP监视器中使用的提供商是否包含有效访问令牌和刷新令牌。
  • 验证是否为要监控的项目创建了提供程序。
  • 验证是否满足先决条件。

2.访问被拒绝。云资源管理器API已禁用。

  • 转到GCP控制台→API和服务→ Library。检查是否启用了Cloud Resource Manager API。
  • 如果您最近启用了此API,请等待几分钟,以便该操作传播并重试。

3.连接到Stackdriver API时身份验证失败。

  • 转到GCP控制台→API和服务→ Library,并确保启用了Stackdriver API和Stackdriver Monitoring API。
  • 检查所选OAuth Provider的参数是否有效。

4.无法获取实例(或者)获取实例错误。

  • 转到GCP控制台→API和服务→ Library,然后检查是否启用了Compute Engine API。
注意:确保您包含正常的Internet连接以从云服务添加或获取数据。如果您的环境需要使用代理服务器访问过多的外部网站,则可以 在管理标签下配置代理设置