CISCO UCS 监控


概述

思科统一计算系统(CISCO UCS)是下一代数据中心平台,它将计算,网络,存储访问和虚拟化结合到一个统一的系统中,旨在降低总拥有成本(TCO)和提高业务敏捷性。

Applications Manager提供了对Cisco UCS环境的监控,您可以在其中监控和跟踪应用程序和系统的各种KPI。它收集实时Cisco UCS数据,以易于理解的仪表板形式显示,并帮助您确定系统偏离理想性能的原因。

创建一个新的监视器

请按照以下给出的步骤创建新的Cisco UCS监视器:

  1. 单击新建监视器 链接。在融合基础结构 类别下,选择Cisco UCS
  2. 指定显示名称
  3. 输入运行Cisco UCS Manager服务器的主机名/IP地址
  4. 指定运行Cisco UCS Manager的端口。默认端口是80。
  5. 如果要通过SSL端口访问Cisco UCS Manager,请选择启用SSL 选项。
  6. 输入凭证详细信息,例如Cisco UCS Manager的用户名密码 以进行身份验证,或在启用从凭证中选择列表 选项后,从凭证管理 列表中选择所需的凭证。
  7. 以秒为单位指定 超时值。
  8. 以分钟为单位指定 轮询间隔
  9. 从组合框中选择要将Cisco UCS Manager与之关联的业务组。(可选) 您可以选择多个组来关联您的监视器。
  10. 单击添加监视器。这将从网络发现Cisco UCS Manager并开始对其进行监控。

监控的参数

通过单击监视器选项卡,转到监视器类别视图。单击 聚合基础结构 表下的Cisco UCS。显示的是Cisco UCS批量配置视图,分布在三个选项卡中:

  • 可用性 选项卡提供了过去24小时或30天的可用性历史记录。
  • 性能 选项卡提供了过去24小时或30天的健康状况和事件。
  • 列表视图 使您可以执行批量管理配置。

从列表中单击监视器后,将转到Cisco UCS监视器仪表板。它有9个标签 -

概述

此选项卡提供有关UCS系统中所有组件总数的详细信息。

参数描述
服务器响应时间:
Response timeCisco UCS Manager的响应时间。(毫秒)
组件:
Total number of Chassis ServersUCS系统中机箱服务器的总数。
Total number of Rack Mount ServersUCS系统中Rack Mount服务器的总数。
Total number of Fabric ExtendersUCS系统中fabric extenders的总数。
Total number of Fabric InterconnectsUCS系统中的Fabric Interconnect总数。
Total number of Processor UnitsUCS系统中的处理器单元总数。
Total number of Adaptor UnitsUCS系统中适配器单元的总数。
Total number of I/O ModulesUCS系统中输入输出模块的总数。

机箱

此选项卡提供有关UCS系统中可用的各种机箱性能指标的详细信息。

参数描述
机箱:
Chassis Name机箱的名称。
Chassis Server Count机箱中存在的机箱服务器数量。
I/O Module Count机箱中输入输出模块的数量。
Fan Count机箱中可用的风扇数量。
Power Unit Count机箱可用的电源单元(PSU)的数量。
Chassis Operational Status机箱的运行状态。(可操作/已降级)
机箱服务器:
Name刀锋服务器的名称。
Chassis Name机箱的名称。
Model刀锋服务器的型号名称。
Operablility表示刀锋服务器的可操作性条件。
Power刀锋服务器的电源状态。(开/关)
Adaptor count可用适配器的数量。
Network Interface Cards存在的网络接口卡的数量。
内存和CPU:
Name刀锋服务器的名称。
Chassis NameChassis Name机箱的名称。
Core count可用的CPU内核数。
Core Enabled启用的CPU内核数。
CPU count可用的CPU数量。
Thread countCPU中可用的线程总数。
Available Memory服务器中可用的内存量。(GB)
Total Memory分配给服务器的内存总量。(GB)
Available Memory %服务器中可用的内存量。(%)
Utilized Memory %服务器使用的内存量。(%)
主板电源:
Name刀锋服务器的名称。
Chassis Name机箱的名称。
Power Consumed主板当前消耗的功率。(瓦)
Max Power Consumed主板消耗的最大功率。(瓦)
Min Power Consumed主板消耗的最低功率。(瓦)
Input Current当前流入主板的输入电流量。(安培)
Max Input Current主板接收的最大输入电流。(安培)
Min Input Current主板接收的最小输入电流。(安培)
Input Voltage当前输送到主板的输入电压量。(伏特)
Max Input Voltage主板接收到的最大电压。(伏特)
Min Input Voltage主板接收到的最小电压。(伏特)
主板温度:
Name刀锋服务器的名称。
Chassis Name机箱的名称。
Front Temperature前面板温度传感器指示的温度值。(摄氏度)
Rear Temperature后面板温度传感器指示的温度值。(摄氏度)
Rear Temperature Left左后面板温度传感器指示的温度值。(摄氏度)

Rack Mount

此选项卡提供有关UCS系统中可用的各种机架式服务器性能指标的详细信息。

参数描述
Rack Mount服务器:
Name刀锋服务器的名称。
Model机架服务器的型号名称。
Operability表示刀锋服务器的健康状况。
Power刀锋服务器的电源状态。(开/关)
Adaptor count可用适配器的数量。
Network Interface Cards可用的网络接口卡的数量。
内存和CPU:
Name机架服务器的名称。
Core Count可用的CPU内核数。
Core Enabled已启用的CPU内核数。
CPU Count可用的CPU数量。
Thread CountCPU中可用的线程总数。
Available Memory服务器中可用的内存量。(GB)
Total Memory分配给服务器的内存总量。(GB)
Available Memory %服务器中可用的内存量。(%)
Utilized Memory %服务器使用的内存量。(%)
主板电源:
Name机架服务器的名称。
Power Consumed主板当前消耗的功率。(瓦)
Max Power Consumed主板消耗的最大功率。(瓦)
Min Power Consumed主板消耗的最低功率。(瓦)
Input Current当前流入主板的输入电流量。(安培)
Max Input Current主板接收的最大输入电流。(安培)
Min Input Current主板接收的最小输入电流。(安培)
Input Voltage当前输送到主板的输入电压量。(伏特)
Max Input Voltage主板接收到的最大电压。(伏特)
Min Input Voltage主板接收到的最小电压。(伏特)
主板温度:
Name机架服务器的名称。
Front Temperature前面板温度传感器指示的温度值。(摄氏度)
Rear Temperature后面板温度传感器指示的温度值。(摄氏度)
Ambient Temperature主板的环境温度值。(摄氏度)
IO Hub1 Temperature RightI/O Hub1的温度值。(摄氏度)
IO Hub2 Temperature RightI/O Hub2的温度值。(摄氏度)

Fabric Interconnect

此选项卡提供有关UCS系统中可用的各种结构互联的性能指标的详细信息。

参数描述
Fabric Interconnect:
Name结构互联(FI)的名称。
Fan与FI相关的风扇数。
Power Supply Unit CountFI中可用的电源设备(PSU)的数量。
结构互联软件:
Name结构互联的名称(FI)
Available Memory服务器中可用的内存量。(GB)
Total Memory分配给服务器的内存总量。(GB)
Cached Memory服务器的缓存内存量。(GB)
Available Memory %服务器中可用的内存量。(%)
CPU utilization %服务器当前的CPU使用率。(%)
结构互联电源单位 (PSU):
NamePSU的名称。
Fabric InterconnectFabric Interconnect的名称(FI)。
Power ConsumedPSU当前消耗的功率。(瓦)
Max Power ConsumedPSU消耗的最大功率。(瓦)
Min Power ConsumedPSU消耗的最小功率。(瓦)
Input Current当前流入PSU的输入电流量。(安培)
Max Input CurrentPSU接收的最大输入电流量。(安培)
Min Input CurrentPSU接收的最小输入电流。(安培)
Input Voltage当前输送到PSU的输入电压量。(伏特)
Max Input VoltagePSU接收的最大电压量。(伏特)
Min Input VoltagePSU接收的最小电压。(伏特)
Fabric Extender:
NameFabric Extender(FEX)的名称。
Fan与FEX相关的风扇数。
I/O ModuleFEX中存在的I/O模块数。
Power Supply Unit CountFEX中存在的电源设备(PSU)的数量。

处理器

此选项卡提供有关UCS系统中可用的各种处理器性能指标的详细信息。

参数描述
处理器
Name处理器的名称。
Equipment处理器所在的设备。
Model处理器的型号名称。
Speed处理器的速度。
Core Count可用的内核数。
Core Enabled已启用的内核数。
Thread Count可用线程数。
CPU TemperatureCPU的当前温度值。
CPU Input currentCPU的当前输入当前值。

风扇

此选项卡提供有关UCS系统中可用的各种风扇的性能指标的详细信息。

参数描述
风扇模块:
Name风扇模块的名称。
Equipment风扇模块所在的设备。
Fans模块中可用的风扇数。
Thermal Condition风扇模块的热状况。
Fan Module Power风扇模块的电源状态。(开/关)
Fan Module Operability表示风扇模块的可操作性。
风扇:
Name风扇的名称。
Fan Module风扇模块的名称。
Equipment风扇模块所在的设备。
Model风扇的型号名称。
Thermal Condition风扇的热状况。
Fan Power风扇的电源状态。(开/关)
Fan Operability表示风扇的可操作性。
Drive Percentage风扇的驱动性能。(%)
Speed风扇的速度。(RPM)
Max Speed风扇的最大速度。(RPM)
Min Speed风扇的最小速度。(RPM)

I/O模块

此选项卡提供有关UCS系统中可用的各种I/O模块的性能指标的详细信息。

参数描述
I/O模块:
NameI/O模块的名称。
EquipmentI/O模块所在的设备。
ModelI/O模块的型号名称。
Thermal ConditionI/O模块的热状况。
Operability表示I/O模块的可操作性。

端口

此选项卡提供有关UCS系统中可用的各个端口的性能指标的详细信息。

参数描述
以太网端口:
Name以太网端口的名称。
Equipment以太网端口所在的设备。
Mac Address以太网端口的MAC地址。
Interface Role以太网端口的接口角色。
Interface Type以太网端口的接口类型。
Ethernet port status以太网端口的运行状态。
Ethernet Admin State以太网端口的管理员状态。
Slot ID与以太网端口关联的插槽ID。
Operational Speed以太网端口的运行速度。
背板端口:
Name背板端口的名称。
Equipment背板端口所在的设备。
Slot ID与背板端口关联的插槽ID。
Mac Address背板端口的MAC地址。
Interface Role背板端口的接口角色。
Interface Type背板端口的接口类型。
BackPlane Port status背板端口的可操作状态。
BackPlane Admin State背板端口的管理员状态。
Fabric端口:
NameFabric端口的名称。
EquipmentFabric端口所在的设备。
Slot ID与Fabric端口关联的插槽ID。
Mac AddressFabric端口的MAC地址。
Interface RoleFabric端口的接口角色。
Interface TypeFabric端口的接口类型。
Fabric Port statusFabric端口的可操作性状态。
Fabric Admin StateFabric端口的管理员状态。

故障

此选项卡提供有关UCS系统中可用故障的详细信息。

参数描述
故障统计:
Critical Faults严重程度为 严重 的故障数。
Major Faults严重程度为 重大 的故障数。
Minor Faults严重程度为 次要 故障数。
Warning Faults严重程度为 告警 故障数。
连续轮询之间的故障:
Fault Code描述故障的故障代码。
Fault Id发生故障的ID。
Type故障的严重性类型。(严重/重大/次要/警告)
Fault Affected object受故障影响的硬件对象。  
Fault Cause发生故障的原因。
Fault Created Time故障产生的时间。
Last transition Time故障状态改变的时间。
Fault Description发生故障的描述。
Show All Faults显示系统中当前存在的所有故障。

受到世界各地客户的喜爱

"具有广泛监控功能的Standout工具"

它允许我们跟踪关键指标,如响应时间、资源利用率、错误率和交易性能。实时监控告警会及时通知我们任何问题或异常,使我们能够立即采取行动。

审稿人角色:研究与开发

我喜欢Applications Manager,因为它可以帮助我们检测服务器和SQL数据库中存在的问题。
卡洛斯·里韦罗

Lexmark技术支持经理

受到全球6000多家企业的信任

我们的客户