본문 바로가기
Professional Engineer/AI

AIOps(Artificial Intelligence for IT Operation)

by 코드네임피터 2024. 9. 20.
반응형

정의

- 빅데이터 분석과 머신 러닝(Machine Learning) 및 AI를 활용하여 IT 인프라(Infra) 문제를 분석과 해결 방법을 제시하는 IT운영을 위한 인공지능(Artificial Intelligence for IT Operations)

 

키워드

- IT 운영 효율화, 수집, 분석, 제어, 가시화, 대시보드

 

메커니즘

기술요소

데이터 수집(Data Collection)
- 빅데이터 플랫폼
- 데이터 수집기
- 스토리지(Storage)
- Infra를 구성하는 각 장비와 프로그램에서 발생하는 이벤트(Event), 로그(Log), 티켓, 모니터링 등의 데이터 와 기존 저장된 데이터를 저장

데이터 분석(Data Analysis)
- 분석 학습 엔진
- 규칙 & 패턴 분석
- 도메인 알고리즘
- 머신 러닝 알고리즘 및 기타 AI 기술로 데이터를 분석하여 정보를 연관시키고, 패턴을 발견하고, 이상을 감지하고, 근본 원인을 결정하고, 서버, 시스템 및 플랫폼 간의 인과 관계를 식별

자동 제어(Automated Reaction)
- API
- Trigger
- Infrastructure Tools
- 분석 결과를 사용하여 작업을 자동화하고 조정하여 핵심사항을 기반으로 작업을 트리거

가시화(Visualization)
- 대시 보드(Dashboard)
- Event View
- Slack
- 관리자가 문제를 식별하고 환경 변경 사항을 추적하고 결정을 내리고 IT 인프라에 대한 일반적인 통찰력을 제공 하는 데 도움이 되는 보고서 및 시각화를 생성

반응형

댓글