题 绩效经理 - 什么柜台?


我们目前正在考虑从传统的服务器环境迁移到SAN / VMWare环境。

我被要求收集主要服务器的性能统计数据 - DC,文件服务器,Exchange以查看它是否适用于我们的环境,或者我们是否会遇到SAN性能问题。

我已经运行了一些超过8小时的预定基线,包括许多计数器,但结果日志太大而无法使用 - perfmon打开它们大约需要三分钟,或者允许我们查看不同的计数器。

虽然我一般都知道哪些对于查看性能有用,哪些是一个足够的监视列表,这将为我们提供一个有用的起点,但是哪些计数器对此有用。

我在想

  • CPU性能
  • 磁盘/文件
  • 网络使用
  • Active Diretory(GPO,Logons等)

但是哪些柜台最有用,我们是否应该特别关注哪些领域?


4
2018-05-19 08:25






答案:


可能会杀死你的最重要的是磁盘IO。收集每秒事务数和每秒读/写扇区数将使您开始确定SAN上需要什么。同时关注内存和页面文件的使用情况,这会对磁盘IO统计数据造成不良影响,并且为虚拟机配置一些额外的内存很简单。

网络可能是下一个最重要的网络,但这很简单 - 聚合传输和每秒数据包,确保它不是太荒谬。

根据我的经验,CPU是现代系统中最不可能的瓶颈。我倾向于不用担心它,除非你有多台机器一直盯住他们的CPU。如果CPU耗尽,则配置额外的VM服务器非常简单。


3
2018-05-19 08:31





经过一番研究后,我认为这是一个很好的通用计数器列表:

逻辑磁盘

  • 平均磁盘秒/读
  • 平均磁盘秒/写
  • % 空闲时间

记忆

  • %已投入使用的字节数
  • 有价值的MBytes
  • 免费系统页表条目
  • 页/秒
  • 池非分页字节
  • 池分页字节

网络

  • 字节总数/秒
  • 输出队列长度

物理磁盘

  • % 空闲时间
  • 平均磁盘秒/读
  • 平均磁盘秒/写
  • 平均磁盘队列长度
  • 平均磁盘字节数/秒

处理

  • 处理数量
  • 私人字节
  • 线程数

处理器

  • %中断时间
  • %处理器时间
  • %用户时间

系统

  • 处理器队列长度
  • 终端服务器(可选)
  • 活跃期
  • 非活动会话
  • 总会话数

3
2018-05-21 10:56



有趣的是,我发现我们的DC在网络流量大致同时飙升 - 课程改变等。文件服务器在这些时间之间飙升 - 这是真正的预期。 - Tubs


对于磁盘绑定,我喜欢监视每个物理磁盘的'\ PhysicalDisk(...)\ Current Disk Queue Length'。

对于使用perfmon查看内容的问题:虽然这可能超出了您的工作范围,但我使用check_nt插件监视带有Nagios的Windows计数器,并在客户端上安装了nsclient ++。然后,我可以使用 n2rrd ,我也可以使用rrdtool创建自定义图形。

您列出的所有内容通常都在vmware / san环境中运行。这实际上只是一个问题,即SAN和虚拟服务器需要具备多大的功能以及正确的架构。如果您愿意将现金花在昂贵的san上,供应商应该能够告诉您需要什么。


2
2018-05-19 11:40



我们不是100%的典型 - 我想没有人是:-)。我们可能遇到的一件事是,大约每小时我们可以有多达600次登录/注销事件,可能超过10分钟。 - Tubs


根据您的使用情况,磁盘IO和网络似乎是转移到VMWare类型基础架构时最关心的问题,特别是如果您的VM存储在SAN上,您绝对应该评估所有计算机的网络使用情况和磁盘IO你会迁移。大多数用于VMWare类型的服务器都应该配备大量的NIC,但是仍然值得考虑的是你可以使用多少个,以及SAN上的磁盘速度。 VMWare ESX支持不立即将所有磁盘更改写回VM的功能,因此您可以通过这种方式节省一些性能。

测量我们使用的性能 RRDTool的 要像Kyle所说的那样获得性能,这非常有用。


2
2018-05-19 13:41





虚拟机与典型服务器不同,因为您遇到了不同领域的问题。大多数情况下,CPU不是瓶颈资源,但RAM是。在你进入之前要真正了解的事情:

  • 磁盘吞吐量 你的存储速度有多快? MB /读取,MB /写入平均值和峰值(如本线程中其他地方所述,RRDTool对此有利)。您知道峰值何时,以及它们是否与存储在同一ESX群集上的其他VM上的I / O峰值一致。在我们的环境中,备份是高峰I / O时间,但我们在白天会得到爆发。对此的答案将告诉您是否可以使用文件支持的磁盘,或者是否必须将当前LUN定向到VM。
  • 网络吞吐量 知道你需要多快。如上所述,备份是我们开始尝试使NIC饱和的区域。知道你正在敲打多少数据。我很确定那里有可以进行VLAN标记的网卡,如果您的网络基础设施支持它,可以减轻负载平衡问题。
  • RAM蠕变 知道你的节目。我们有一个会消耗给它的每一点内存,这会导致VMWare控制台抱怨和抱怨使用,并建议给它更多。如果您没有像我们这样悲惨的资金不足,希望您的ESX服务器将配置大量的RAM。在我们的环境中,我们认为VM是“小猪”,如果它 需求 超过1GB的RAM。你的可能会有所不同。

确定您是否可以使用文件支持的磁盘,或者您是否需要直接呈现的LUN可能需要一些了解。直接呈现的LUN是存储阵列将LUN直接呈现给VM的位置,使用起来更容易 NPIV。你可以在没有NPIV的情况下做到这一点,但它可能对你的血液来说太危险了,所有全新的光纤通道硬件应该支持它,而ESX 3.5肯定会支持它。 Direct present删除了存储阵列和虚拟机之间的抽象层,从而可以提供更好的性能。然而,直接呈现设置起来比较棘手,并且在“绕过它”的阶段具有更高的启动时间。

文件备份磁盘非常简单。另外,它们可以非常简单地在存储阵列之间移动(对于某些简单的值,在复制多GB文件的情况下),直接呈现需要(通常是非常昂贵的)阵列级复制软件来完成。低I / O负载的东西在文件支持上起作用,甚至一些更高的I / O事情。我们正在为文件支持的磁盘上的3000多个用户运行完整的Exchange 2007安装。备份可能会更快,但在白天,用户不会注意到任何减速。


2
2018-05-19 14:29