管理员不时关闭他们的主机进行服务。关闭维护一个节点后,vSAN集群资源要重新分配,这时Maintenance Mode就派上用场了。今天,我想讨论一下维护模式的整体概念及其选项。
在独立主机上启用维护模式
一旦主机进入维护模式,它在“摘要”选项卡中的图标和状态就会发生变化。
此标志表示无法对该主机执行任何 I/O。也没有活动的客户端网络会话。由于这两个原因,您无法在该主机上运行或创建 VM(它们基本上都已关闭),而该主机正在维护中。
主机可以自动离开维护模式(在某些过程完成后),或根据用户请求。请注意,重新启动不会使主机恢复正常运行。但是,在使用 vSphere Update Manager 进行任何更新时,有一个选项可以在重启后退出维护模式。
如何将主机置于维护模式?
您可以通过 vCenter 激活维护模式。
对于独立主机,您也可以在 Web 控制台中进入此模式。
对于使用 CLI 的用户,有一种方法可以从 SSH 会话进入该模式。这里有 3 个命令可能会派上用场:
esxcli system maintenanceMode get informs whether maintenance mode is enabled.
esxcli system maintenanceMode set –enable true enables maintenance mode on the host.
esxcli system maintenanceMode set –enable false disables maintenance mode.
您可以使用 PowerCLI 从 vCenter 实例执行相同的过程。以下是一些命令:
Connect-VIServer “My vCenter IP” -user “user@domain” -password “password” enables to connect to a vCenter Server instance.
Get-VMHost -name “My ESXi host IP” informs about the current host state.
Set-VMHost -VMHost “My ESXi host IP” -State “Maintenance” -RunAsync set the host into maintenance mode.
Set-VMHost -VMHost “My ESXi host IP” -State “Connected” –RunAsync brings the host to the normal state.
Disconnect-VIServer 172.16.10.5 -confirm:$false disconnects you from the vCenter Server instance.
这是命令输出。
它在 vSAN 集群中如何工作?
在我进一步讨论之前,我想阐明 vSAN 集群中某些主机的维护模式的整个概念。长话短说:通过对主机进行维护,基本上可以断开它与集群的连接。换句话说,您暂时移除了该集群的容量和计算能力。当然,这会触发工作负载分配机制,但您需要非常小心,因为您的 VM 可能会变得有点迟钝,或者甚至可能存在一些稳定性威胁。
在某些主机上启用维护模式时,会弹出一条消息,告诉您主机维护模式选项以降低风险:
- 全量数据迁移
- 确保可访问性
- 无数据迁移
全量数据迁移
如果您强烈感觉主机将关闭很长时间,那么这是正确的选择。请记住,迁移是一个 I/O 密集型过程,与繁重的网络负载相关联。因此,请设置迁移不会与您的生产活动重叠的时间。好消息:进入维护模式向导提供了必须迁移的大概数据量(该参数可以转换为时间)。请注意,在数据传输结束之前,主机无法关闭。下面的方案显示了数据是如何被疏散的。
以下是如何开始从主机迁移所有数据。
确保可访问性
确保可访问性是默认维护模式选项。当您短时间关闭主机(即更新 ESXi、更换一些磨损部件等)时,它工作正常。与上面讨论的选项不同,当您希望关闭主机超过一天时,不建议使用此选项:性能和稳定性下降的风险很大。
这种模式是稳定性和迁移持续时间之间的正确平衡。只完成了部分迁移:只需要尽可能少的文件来确保 VM 正常运行,同时服务器保持关闭状态。这是一个显示Ensure 可访问性如何工作的方案。红色标志表示节点停止时数据始终不可用。
请注意,启用Ensure 可访问性模式可能会导致存储策略发生变化。集群临时使用一些资源,因此 vSAN 自然会尽量避免任何性能、稳定性和数据丢失事件。进入维护模式向导显示有多少数据需要撤出以及有多少对象可能与新的存储策略不兼容。它还指示要传输的数据量,以便您可以在需要时释放一些数据存储空间。
默认情况下,将主机设置为维护模式后,在同步开始之前有 60 分钟的窗口,新的存储策略将应用于 VM。您可以通过设置更大的对象修复时间值来延长等待时间。
无数据迁移
正如此选项的名称所暗示的那样,根本没有完成任何数据迁移,这意味着它是将主机置于维护模式的最快方法。但是,这是最危险的一个:存在一些虚拟机由于固定到离开集群的主机而宕机的风险。
如果您准备好冒这个风险,这里介绍了如何将主机置于没有数据迁移的维护模式。
结论
维护模式允许以更方便的方式管理 vSphere 环境,但是您应该了解与此功能相关的风险。好吧,我相信这篇文章足以涵盖维护模式,提供了启用它之前应该了解的重要信息。