vRealize Opertion Manager 6之NetApp存储性能监控组件介绍

vRealize Operation Manager 6 (又叫vROps)是vCenter Operation Manager的全新版本,我从vCenter Operation Manager还是1.0时就开始使用了,很喜欢自我学习和动态阀值这两个功能。但是这款产品只能监控虚拟层面,如果可以监控存储层面就完美了。在比较大的vSphere环境中虚拟机是共享ESXi数据存储(datastore)的,如果少数虚拟机产生很高的IO,可能会影响到其他处于同一个存储上的虚拟机。想象一下,如果你有100个LUN跑在一个NetApp存储上,300个虚拟机在使用这100个LUN,某日用户说他们的虚拟机很慢,但是他们并没有跑什么应用,这时候就会比较难判断到底是哪儿出了问题,因为虚拟机可能共享同一个数据存储(datastore),数据存储存建于LUN上,LUN 可能来自某个聚合(Aggregate),并且多个LUN可能来自同一个物理磁盘。vCenter Operation Manager 在5.x时代有提供一款NetApp存储监控组件,但问题是很难把vSphere的数据存储(Datastore)和NetApp存储的设备关联起来。

[do_widget “Language Switcher” wrap=aside title=false]

几个月前,我有看到一款兼容vRealize Operation Manager 6的全新NetApp存储监控组件发布了,但是它不是VMware开发的,而是Blue Medora。有幸测试了一下这款名叫Blue Medora NetApp Storage Management Pack for vRealize Operation Manager 6的组件,印象深刻!该组件安装非常简单,只要下载PAK文件,导入vRealize Operation Manager即可。该组件支持NetApp存储的7-Mode和Cluster-Mode。该组件需要利用DMF服务器或NetApp API服务器从7-Mode或Cluster-Mode的存储收集性能数据。

初始化设定并指派许可后,该组件开始自动收集性能数据。它会从存储系统、聚合(Aggregate)、LUN、卷、集群(适用于Cluster-Mode)等多个层面收集数据。你可以从vRealize Operation Manager界面左侧面板的 Environment – Inventory Trees
找到收集到的对象。

该组件自带的仪表盘完全可以满足日常监控需要。通过自带仪表盘的数据可以轻易获得当前整个环境的状态或者某个具体虚拟主机以及关联存储的性能。比如下图的 NetApp Overview
仪表盘用颜色显示存储设备当前选择的测量器的性能状态,很容易看到当前整个存储环境的状态。另一个例子是下图的 NetApp Virtual Machine Troubleshooting
仪表盘,当你选择一个虚拟机时,它会自动显示关联的数据存储(Datastore)、LUN、卷等,然后如果你选择某个对象它会显示可用的测量器。

内置仪表盘
NetApp Overview仪表盘
NetApp Virtual Machine Troubleshooting仪表盘

以下截图是Blue Medora NetApp Storage Management Pack for vRealize Operation Manager 6 可收集的测量器和自定义报告功能。由于可收集的测量器实在太多了,我只展开了LUN的部分。只要数据收集正常你就可以用这些测量器创建自己的仪表盘和报告。报告功能提供PDF和CSV两种格式,非常适合用于进一步的数据分析和PPT。

测量器
报告样例

另一个用处是该组件能够监控存储容量并触发vROps警报系统,如果你可以把vROps的警报系统和你的工单系统整合,当存储性能或容量下降时,运维小组就会收到自动收到工单。最后,关于许可证,该组件根据存储系统数量来计算许可证数量,媒体价格是每5个系统低于1万美元(不知道把价格放这里是否合适?)。和其他存储性能监控工具相比,我觉得这个价格还可以吧,我可知道某些工具要么按照存储容量计费的要么极其昂贵!

个人认为 Blue Medora NetApp Storage Management Pack for vRealize Operation Manager 6 是一款可用于排错的完美组件,你可以非常容易的找到哪个虚拟机有问题、存在于哪个存储上、以及存储的性能问题等。前文有说虚拟化环境是一个资源共享的基础架构,作为虚拟化管理员,出现性能故障时你必须知晓当前架构的每个层面。而 Blue Medora NetApp Storage Management Pack for vRealize Operation Manager 6 提供了存储方面的性能数据,和vROps里虚拟层面的数据相结合可以让你很快的判断出问题在哪儿(根据我的经验,在各种原因引起的虚拟机性能下降故障中,存储引起的故障最难判断),另外,和vROps的警报系统整合还可以降低运维费用。