如何监控云中的盲点以及进行处理

2024/2/5 13:38:54 资讯频道 593

如今,云采用正在增长,因为它具有许多优势,例如在需要时轻松配置新资源。另外,通常还有短期资金成本节省。

云计算不仅仅是SaaS;有许多第三方提供商使用云计算服务,包括DNS、CDN和API。

这意味着要监控的内容比以往任何时候都多,本文将介绍避免复杂基础设施带来的最大盲点的最佳方法。

而本文涵盖的3个盲点是:

?第三方控制什么

?用户控制什么

?企业可以控制什么

1.第三方控制什么

由于很多企业将业务迁移到云平台,将不再控制其所依赖的大部分网络。其云计算提供商可能会或可能不会监控他们自己的基础设施。企业的供应商也在使用云计算解决方案和其他第三方,因此企业和其客户都依赖于许多互连。

使用SaaS,无需编写任何代码。相反,只需打开浏览器窗口并登录。企业也许可以自定义各个方面,但控制权最终掌握在提供者手中。

(1)选择合适的第三方

企业将需要第三方,因此最好的第一步是选择合适的第三方。

?确保他们了解您的业务需求,并且有一个相互的服务等级协议(SLA),并且他们需要遵守。

?如果企业将业务迁移到云平台,则必须为迁移前和迁移后制定可靠的计划。监控系统将帮助企业在迁移业务前后对性能进行基准测试,以便可以在需要时进行改进。

(2)制定冗余计划

一旦企业选择了合适的第三方来满足其业务需求,就该制定冗余计划了。

?为所有第三方提供备份,因为企业无法控制第三方中断,只能控制你的准备。

?为发生停电时发生的事情制定计划。谁负责与第三方沟通?企业将如何与内部团队沟通?

?除了拥有备份CDN、服务器和应用程序之外,企业还需要制定一个备份计划,以便在发生中断时该怎么做。企业与团队一起制定与用户沟通的计划,并准备好一个备份站点,以了解如何使这个备份站点不仅仅是一个错误页面。

(3)管理第三方标签

应该使用信誉良好的标签管理器。这将帮助企业快速解决问题,通常是在问题影响其客户之前。

?确保知道标签在哪里以及它们属于哪些第三方。

?在活动期间尽可能保持标签简洁。消除您不需要的任何不必要的广告标签。如果企业必须在那里放置广告,需要确保它们没有提供Flash、视频或大图像文件。

2.企业的用户控制什么

这并不总是企业网站上的某些东西的错。它可能是浏览器问题、设备问题或地理问题——所有这些都由企业的用户决定。

安全机构曾经检测到InternetExplorer用户的加载时间错误。事实证明,这是JavaScript和iframe的问题——但如果他们的用户使用的是InternetExplorer而不是其他浏览器,则无法采取任何措施来提高速度。

企业无法控制用户的浏览器,但可以执行以下操作:

?企业不选择他们的设备。因此需要确保您的网站具有响应性。

?企业不选择他们的位置。因此部署多个CDN以在其主要存在点(PoP)更快地交付内容。

3.企业控制什么

信不信由你,有许多流行的盲点在企业的控制之下。也就是说,企业并没有监控基础设施的所有部分。以下是一些例子。

(1)MQTT

MQTT是一种支持物联网的机器对机器(M2M)协议。监控MQTT意味着企业可以发现其设备或用户设备之间发生的中断。查明MQTT问题将帮助企业的团队提高平均解决时间(MTTR)。

(2)API

监控API将帮助企业查明执行不佳的情况,并检测导致特定问题的API或位置——无论是内部API还是外部API。这是改进关键业务交易的关键,例如企业的结账流程。

(3)域名系统

如果没有监控DNS,那么就错过了客户/客户旅程中的一个关键点,他们旅程的一开始——以及一个可以建立或破坏他们对企业的品牌忠诚度的关键点。如果他们无法访问企业的网站,那么需要了解它。

(4)SMTP

如果企业监控SMTP服务器,则可以提高应用程序可用性,并快速检测中断和协议故障。企业将能够确定中断是由于连接失败还是用户浏览器不支持SSL。

监控盲点

尽管无法控制第三方、云或用户行为,但企业仍然可以部署一些监控最佳实践,以帮助自己快速检测问题,并提高平均解决时间(MTTR)。

这些监控实践将确保企业的第三方满足其要求,它们还将帮助企业确定问题是自己的问题、供应商的问题还是SaaS提供商的问题。

(1)云端

云中的应用程序应该具有比迁移前更好或相同的性能。要测试企业的云计算提供商是否满足性能要求,企业应该结合使用合成和真实用户监控。

在将业务完全迁移到云平台之后,可以继续使用RUM和Synthetic,以确保企业的第三方遵守服务等级协议(SLA)。

(2)综合监控

如果没有综合监控,就无法将问题扼杀在萌芽状态。综合监控意味着企业可以使用SaaS应用程序和第三方自动执行典型的用户行为。可以监控页面加载、响应和事务时间。

(3)真实用户监控

企业不能仅仅依赖合成,因为其户可能会体验到不同的东西,企业需要确切地知道他们的体验是什么。

(4)结合RUM和Synthetic

增加合成用户以测试新功能或为高流量事件做准备。查看不同PoP的RUM—即,确保没有从AWS中查看AWS中的用户。

企业的用户在哪里

企业需要从用户所在的任何位置(即PoP)衡量性能。监控解决方案应衡量用于从世界各地的互联网骨干网交付SaaS应用程序的互联网服务质量。包括支持应用交付的DNS和加速服务以及内部网络服务。

三个关键要点

当谈到云中的盲点时,没有比做好准备更好的方法来处理它们。

?确保选择正确的云计算供应商。

?为企业的每一个基础设施(包括备份站点)准备好备份。

?监控基础设施的每一个部分,以便确定问题所在并改进MTTR。