Grafana rules프로젝트를 진행중에 Grafana에서 CPU 사용량이 50% 이상일 때 자동으로 Slack에 알림이 전송해야하는 요구사항이 있었습니다. CPU 사용량이 50%이상일 때 Slack으로 알람을 보내려면 먼저 사용 중인 모니터링 시스템에 따라 적절한 CPU 사용량 메트릭을 선택해야 합니다. 현재 저희 프로젝트에서는 모니터링 시스템을 Prometheus로 지정했습니다. 1. Grafana 대시보드에서 "Alerting" 메뉴로 이동2. "New alert rule"을 클릭하여 새 알림 규칙 생성3. "Query" 섹션에서 위의 메트릭 중 하나를 선택 CPU 사용량을 모니터링하기 위해서는 system_cpu_usage 또는 process_cpu_usage 메트릭을 사용해야 합니다. sy..
grafana
Grafana loki란❓Grafana Loki는 Grafana Labs에서 개발한 오픈 소스 프로젝트로, 로그 데이터 집계 시스템입니다. Loki는 Prometheus의 메트릭 수집 방식과 유사하게 주로 로그 데이터를 수집하고 저장하며, Grafana와의 원활한 통합을 통해 강력한 시각화와 분석 기능을 제공합니다. Grafana loki 특징간단한 설계Loki는 로그 데이터를 효율적으로 처리하기 위해 간단한 구조를 채택하고 있습니다. 데이터 저장과 검색은 메타데이터와 로그 스트림에 기반하며, 실제 로그 내용은 압축된 형태로 저장됩니다. 이러한 접근은 관리와 유지보수를 용이하게 만듭니다.Label 기반 저장로그 데이터는 라벨 구분되어 저장됩니다.이를 통해 다양한 쿼리와 필터링이 가능하며, 필요한 로그를..
현대 IT 환경에서 시스템의 성능과 상태를 실시간으로 모니터링하는 것은 매우 중요합니다. 그러나 문제 발생 시, 그 상황을 빠르게 파악하고 대응하는 것이 더욱 중요합니다. Grafana는 이러한 상황을 대비해 다양한 알림 기능을 제공하며, 그 중에서도 Slack과의 연동을 통해 알림을 실시간으로 팀에 공유할 수 있습니다. 서론 본 글에서는 이전 포스팅과 동일하게 Spring boot, Prometheus, Grafana를 사용합니다. Spring-boot에서 Prometheus Exporter를 통해서 Prometheus 서버로 로그를 전송하고, Prometheus가 수집하고 있는 로그를 Grafana가 다시 로그를 수집해서 대시보드로 보여주게 만들었었습니다. [Grafana] Prometheus와 ..
본 글은 Grafana에 대해서 공부한 지식을 정리한 글입니다.앞선 "Prometheus"포스팅에서 알아보았듯이 Prometheus는 시스템의 상태를 수집하고 분석하는 데 매우 유용한 도구입니다. 하지만, 수집된 시계열 데이터는 그 자체로는 해석하기 어려울 수 있습니다. 단순히 수치 데이터를 나열하는 것은 시스템의 성능을 이해하는 데 한계가 있습니다. 이때 데이터의 추세와 패턴을 직관적으로 파악할 수 있도록 도와주는 도구가 필요합니다. 바로 이 역할을 수행하는 것이 Grafana입니다. Grafana란❓Grafana는 오픈소스 데이터 시각화 및 분석 도구로, 다양한 데이터 소스에서 데이터를 시각적으로 표현하는 데 최적화되어 있습니다. 대시보드 및 차트, 그래프를 통해 데이터를 효과적으로 분석하고 모니터..