当前位置: 首页 > news >正文

AWS S3 可观测性最佳实践

AWS S3 介绍

AWS S3(Amazon Simple Storage Service)是一种可扩展的对象存储服务,提供高可用性、持久性和安全性。它允许用户存储和检索任意数量的数据,并通过简单的 Web 服务接口访问这些数据。S3 支持多种存储类别,包括标准存储、智能分层存储、不频繁访问存储和归档存储,以满足不同的性能和成本需求。此外,S3 还提供丰富的功能,如版本控制、生命周期管理、数据加密和跨区域复制,帮助用户管理和保护数据。其高度可扩展性和灵活性使其成为企业和开发者的理想选择,广泛应用于备份、存档、大数据分析和内容分发等场景。

观测云

观测云是一款专为 IT 工程师打造的全链路可观测产品,它集成了基础设施监控、应用程序性能监控和日志管理,为整个技术栈提供实时可观察性。这款产品能够帮助工程师全面了解端到端的用户体验追踪,了解应用内函数的每一次调用,以及全面监控云时代的基础设施。此外,观测云还具备快速发现系统安全风险的能力,为数字化时代提供安全保障。

部署 DataKit

DataKit 是一个开源的、跨平台的数据收集和监控工具,由观测云开发并维护。它旨在帮助用户收集、处理和分析各种数据源,如日志、指标和事件,以便进行有效的监控和故障排查。DataKit 支持多种数据输入和输出格式,可以轻松集成到现有的监控系统中。

登录观测云控制台,在「集成」 - 「DataKit」选择对应安装方式,当前采用 Linux 主机部署 DataKit。

数据采集

  1. 登陆观测云控制台
  2. 点击【集成】菜单,选择【云账号管理】
  3. 点击【添加云账号】,选择【AWS】,填写界面所需的信息,如之前已配置过云账号信息,则忽略此步骤
  4. 点击【测试】,测试成功后点击【保存】,如果测试失败,请检查相关配置信息是否正确,并重新测试
  5. 点击【云账号管理】列表上可以看到已添加的云账号,点击相应的云账号,进入详情页
  6. 点击云账号详情页的【集成】按钮,在未安装列表下,找到 AWS S3,点击【安装】按钮,弹出安装界面安装即可

关键指标

指标名称描述单位
5xxErrors服务器端错误的请求数量。这些错误通常是由S3服务端问题引起的,例如内部服务器错误(500)、服务不可用(503)等。计数(Count)
AllRequests所有请求的总数,包括成功请求和失败请求。这个指标可以用来监控S3存储桶的整体请求负载。计数(Count)
BucketSizeBytes存储桶中所有对象的总大小。这个指标可以用来监控存储桶的存储使用情况。字节(Bytes)
BytesDownloaded从S3存储桶中下载的数据量。这个指标可以用来监控数据的读取量。字节(Bytes)
BytesUploaded上传到S3存储桶的数据量。这个指标可以用来监控数据的写入量。字节(Bytes)
FirstByteLatency从请求开始到第一个字节返回的时间。这个指标可以用来衡量S3的响应速度。毫秒(Milliseconds)
GetRequests对S3存储桶中对象的GET请求的次数。这个指标可以用来监控对象的下载请求量。计数(Count)
HeadRequests对S3存储桶中对象的HEAD请求的次数。HEAD请求通常用于获取对象的元数据而不下载对象本身。计数(Count)
ListRequests对S3存储桶中对象列表的请求次数。这个指标可以用来监控对存储桶中对象列表的查询操作。计数(Count)
NumberOfObjects存储桶中对象的数量。这个指标可以用来监控存储桶中对象的总数。计数(Count)
PutRequests对S3存储桶中对象的PUT请求的次数。PUT请求通常用于上传新对象或覆盖现有对象。计数(Count)
TotalRequestLatency所有请求的总延迟时间。这个指标可以用来衡量S3处理请求的整体性能。毫秒(Milliseconds)

场景视图

登录观测云控制台,点击「场景」 -「新建仪表板」,输入 “AWS S3”, 选择 “AWS S3 监控视图”,点击 “确定” 即可添加视图。

S3 bucket 列表可以查看对应区域 S3 bucket 开通信息

请求指标主要是包含 S3 对象数据被外部访问的请求相关指标

监控器(告警)

观测云内置了监控器模板,可以选择从模版创建监控器,并开启适合业务的监控器以及时通知相关成员关注问题,触发条件、频率等信息可以依据实际业务进行调整。

登录观测云控制台,点击「监控」 -「新建监控器」,输入 “AWS S3”, 选择对应的监控器,点击 “确定” 即可添加。

AWS S3 HTTP 请求量存在突增突降异常

总结

通过将 AWS S3 的原生监控数据集成到观测云平台,用户可以实现对 S3 存储桶的实时性能监控、资源使用分析以及安全事件的可视化。观测云的高级分析和可视化功能,如实时仪表板、智能告警和根因分析,能够帮助用户快速定位问题、优化成本,并确保数据的高可用性和安全性。这种结合不仅提升了监控的效率和准确性,还通过集中管理的方式简化了运维流程,使用户能够更好地应对复杂的云环境挑战。

http://www.lqws.cn/news/504361.html

相关文章:

  • Sentinel(三):Sentinel熔断降级
  • python的轻院网购商城管理系统
  • 【Bugku】简单取证1
  • 深度洞察丨2025零信任应对挑战,拥抱变革,开启智能安全新时代
  • 技术伦理之争:OpenAI陷抄袭风波,法院强制下架宣传视频
  • 入门k8s-Pod
  • k8s强制删除podpvpvc和nsnamespace
  • 《陈欣与链接器的黄昏》
  • 华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并创建小红书爆款文案大模型
  • 软件工程:从理论到实践,构建可靠软件的艺术与科学
  • python有哪些常用的GUI(图形用户界面)库及选择指南
  • 通义灵码编程智能体深度评测(Qwen3模型+终端操作+MCP工具调用实战)
  • STM32 环境监测与控制系统的设计与实现
  • 认识Scikit-learn/PyTorch/TensorFlow这几个AI框架
  • 从代码学习深度学习 - 情感分析:使用循环神经网络 PyTorch版
  • 国产安路FPGA纯verilog视频图像去雾,基于暗通道先验算法实现,提供5套TD工程源码和技术支持
  • 帮助装修公司拓展客户资源的微信装修小程序怎么做?
  • 开篇-认识Gin——Go语言Web框架的性能王者
  • 接口自动化测试之 pytest 接口关联框架封装
  • Qt 中使用 gtest 做单元测试
  • 如何一次性将 iPhone 中的联系人转移到 PC
  • Learning to See in the Dark 论文阅读
  • 安卓android com.google.android.material.tabs.TabLayout 设置下拉图标无法正常显示
  • ubuntu虚拟机扩容
  • 【计算机网络】期末复习
  • centos 7 mysql 8 离线部署
  • (3)ROS2:6-dof前馈+PD / 阻抗控制器
  • 【Vue】 keep-alive缓存组件实战指南
  • C# VB.NET中Tuple轻量级数据结构和固定长度数组
  • 第五课:大白话教你用K邻近算法做分类和回归