可观察性是监控的超集。除了提供对隐式故障模式的详细洞察之外,它还提供了系统健康状况的高级概述。此外,可观察系统还提供了有关其内部运作的储备,能够发现更深层次的系统性问题。
一旦服务部署到生产环境中,我们想知道它每秒请求数、资源利用率等方面的执行情况。此外,如果出现问题,希望能得到即时警报,例如服务实例失败或者磁盘空间不足,最好是在影响用户体验之前得到警报。如果出现问题,我们需要能够排除故障并进行 RCA(根本原因分析)。
作为服务开发人员,我们应该实现几种模式,让服务管理和故障排除更容易。以下五种模式可以帮助我们设计可观察的服务:
有时,服务可能正在运行但无法处理请求。新启动的服务实例可能仍在初始化并进行一些健全性检查,然后才能处理请求。部署基础架构在准备好处理 HTTP 请求之前,将其路由到服务实例是没有意义的。
也可能出现服务实例没有终止就失败的情况,例如所有的DB连接都用完了,无法访问数据库。部署基础设施不应将请求路由到失败但仍在运行的服务实例;如果服务实例无法恢复,则必须终止它,并创建一个新实例。服务实例必须能够告诉部署基础设施它是否能够处理请求。您可以使用实现健康端点的Spring Boot Actuator来为您的服务实现健康检查端点。
日志聚合模式可以进行故障排除。如果您想确定应用程序出了什么问题,日志文件是一个很好的起点。登录微服务架构可能具有挑战性,因为日志内容分散在不同服务的日志文件中。
日志聚合是解决方案。日志聚合服务将所有服务实例的日志发送到集中式日志服务器。当日志被日志服务器存储时,它们可以被查看、搜索和分析。还可以设置在日志中出现某些消息时触发警报。
日志基础设施负责聚合日志、存储日志,并使用它进行搜索。许多流行的工具都提供了日志聚合,例如Splunk、Fluentd、ELK stack、Graylog等。
假设您正在对 API 响应缓慢进行故障排除,这个 API 可能涉及多个服务。使用分布式跟踪可以深入了解应用程序正在做什么。分布式跟踪器类似于单体应用程序中的性能分析器。记录有关处理请求时进行的服务调用的信息。然后,您可以看到服务在处理外部请求期间如何交互,以及在每个服务上花费了多少时间。
每个外部请求都被分配一个唯一的 ID,并在它从一个服务流向另一个提供可视化和分析的集中式服务器上进行跟踪。分布式追踪服务器包括Zipkin、Jaeger、OpenTracing、OpenCensus、New Relic等。
服务记录异常,帮忙确定原因很重要。异常表示存在问题或程序错误。日志用于查看异常,甚至可以配置日志服务器,方便在异常时提醒运维人员。然而有几个缺点需要注意:
异常跟踪服务是一种非常好的异常跟踪方法。服务向集中式服务报告异常,该服务对异常进行重复数据删除、生成警报和异常管理。可以使用Honeybadger和Sentry等实现异常跟踪服务。
监控和警报是生产环境的关键组件。监控系统从其技术堆栈的所有部分收集提供有关应用程序运行状况的关键信息的指标。这些指标的范围从基础架构级别的指标(例如 CPU、内存和磁盘利用率)到应用程序级别的指标(例如服务请求延迟和处理的请求数量)。
度量标准是服务开发人员的责任,有两种方式。首先必须检测服务,收集有关行为指标。其次,必须将这些服务指标以及来自 JVM 和应用程序框架的指标公开给指标服务器。应用程序指标服务可以像 AWS CloudWatch 服务或Prometheus服务器一样轮询端点以检索指标。Grafana是一种数据可视化工具,可用于在 Prometheus 中查看指标。
每个用户的操作都被审计日志记录下来。通常,审核日志用于提供客户支持、确保合规性和检测可疑活动。审计日志条目记录用户的身份、他们执行的操作以及涉及的业务对象。审计日志通常存储在数据库表中。
审计日志可以通过几种不同的方式实现:
根据定义,可观察性模式不是关于日志、指标或跟踪,而是关于在调试期间由数据驱动并使用反馈来迭代和改进产品。
网站标题:微服务架构的可观察性设计模式
网页地址:http://www.csdahua.cn/qtweb/news9/427409.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网