ITOA(IT operations analytics)에 대한 이해와 기술 동향

기술/표준화/보안BRIEF
2017년 8월 28일 | 조회수 1155

박병훈 T3Q 대표

ITOA란 무엇인가

  • IT Operation Analytics(IT 운영분석)는 IT 운용에 있어서 발생하는 대용량의 로그, 이벤트 데이터를 검색, 분석 및 리포트 하도록 하여 시스템의 장애 원인 파악이나 해결 대책에 이용되는 방법 또는 시스템을 말함
  • ITOA는 비즈니스 정보를 추출할 수 있는 대용량 데이터 집합에 빅데이터 분석을 적용하여 복잡한 패턴을 찾아내고 이를 학습함으로써 이상 징후의 예측은 물론 전체 시스템의 안정적이고 원활한 운용에 도움을 주는 분석 결과를 제공해주는 기술임
  • [그림 1]에서 처럼 IT 운용 과정에서 발생하는 다양한 로그데이터 및 머신 데이터 등을 수집, 저장, 분석 등의 빅데이터 처리를 하여 특정한 패턴이나 통계, 오류 등을 찾아 시스템의 운용 모니터링에 활용됨은 물론 관련된 비즈니스 정보까지도 추출할 수 있음

[그림 1] ITOA 구조 및 처리 프로세스


ITOA는 왜 필요한가

  • ITOA를 한 마디로 정의하자면 ‘예측 분석’이라고도 할 수 있는데 이는 기업의 경쟁 유지에 필수적인 핵심 역량으로 기술적으로는 시스템의 오류나 가용성, 장애 위험도 등을 사전에 예측하고 조치를 취함으로써 안정적인 서비스가 가능하도록 해주는데 대표적인 기능은 다음과 같음
  1. 근본 원인 분석 : IT 인프라나 애플리케이션들의 상태 모니터링은 전체 시스템의 동작에 있어서 알 수 없는 작은 오류나 근본 원인을 찾아내는데 도움을 줌
  2. 서비스 성능과 가용성의 사전 관리 : 시스템의 추후 상태와 그에 따른 성능 영향을 예측 가능함
  3. 문제점(이슈) 배정 : 문제점을 해결할 방법을 결정하거나, 예상되는 방법을 적합한 개인 또는 그룹에 통지함
  4. 서비스 영향 분석 : 다수의 근본 원인이 파악됐을 때, 관련 영향도를 분석하고 우선 순위를 결정하여 최단 시간, 최소 비용으로 문제를 처리할 수 있도록 제안을 해줌
  • 여기에 더하여 비즈니스 인텔리전스 (Business Intelligence) 라고 해서 사용자들의 이용 패턴, 특정 행동 등과 시스템의 운용 데이터를 조합 분석하여 사용자 유형 분석이나 특정 비즈니스의 성공 가능성 예측 등 사업/마케팅적인 정보까지도 얻을 수 있는데, 이러한 사업/마케팅 정보는 회사의 비즈니스 방향 결정에 대한 근거 자료로 활용될 수 있으므로 운영진이나 실무진의 직관적인 결정보다 훨씬 더 객관적이고 신뢰도가 높으며 위험도는 낮다고 할 수 있음
  • ITOA를 이용한 예측 모델은 기계학습(Machine Learning)을 적용함으로써 보다 정확한 결과물을 얻을 수 있는데 이는 기업의 핵심 전략 목표 달성에 도움이 될 수 있음
  • 기업의 핵심전략 목표로는 경쟁력의 원천 확보, 경쟁 상황에서의 매출 증대 및 고객 유지, 비즈니스/서비스의 무결성 유지, 핵심 사업 역량의 강화, 고객의 만족도 제고, 첨단의 분석 기술 도입, 완성도 높은 비즈니스 인텔리전스 실현을 들 수 있는데 이 목표들이 ITOA가 필요한 이유라고 볼 수 있음

ITOA와 관련된 기술은 무엇인가

  • ITOA는 빅데이터 처리 기술을 근간으로 하고 있는데 빅데이터란, 기존의 데이터베이스 관리도구로는 처리가 불가능한 대량의 정형 또는 비정형의 데이터 집합으로부터 가치를 추출하고 분석하기 위하여 데이터의 생성, 수집, 분석, 표현 등의 처리를 통하여 특정 업무 또는 사업에 필요한 정보를 제공, 관리하는 기술/시스템을 말함
  • 빅데이터는 다양한 형태의 데이터가 매우 빠른 속도로 엄청나게 발생하므로 이를 분산해서 처리하기 위한 고성능의 하드웨어 시스템과 함께, 분산된 시스템을 연결해서 통합 관리하는 소프트웨어도 필요한데 빅데이터 처리를 위해서는 대표적으로 Mapreduce나 Hadoop 등의 기술이 사용됨

[그림 2] 빅데이터 처리 프로세스

  • 인공지능이란 사람과 유사한 지능을 가지도록 인간의 학습능력, 추론능력, 지각능력, 자연어 이해능력 등을 컴퓨터 프로그램으로 실현하는 기술로 대표적으로는 기계학습(Machine Learning)이 있음
  • 기계학습(Machine Learning)은 기계 스스로 대량의 데이터로부터 지식이나 패턴을 찾아 학습하고 예측을 수행하는 것인데 그 방법 중 하나인 딥러닝(Deep Learning)은 컴퓨터가 스스로 학습할 수 있게 하기 위해 인공 신경망을 기반으로 하여 인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 사물을 구분하는 정보처리 방식을 모방하는 것임

[그림 3] 인공지능의 기본 원리와 방식

  • ITOA 플랫폼의 논리 구성을 살펴보면 클라우드(IaaS, PaaS) 및 빅데이터기반의 현상 분석을 위해 앞서 언급된 수집 프레임워크, 실시간 처리 프레임워크, 다양한 목적의 저장소, 배치 분석 등의 빅데이터 인프라가 활용되며, 현상분석에서 더 나아가 예측을 위해서는 딥러닝 등 기계학습을 위한 프레임워크가 필수적임
  • 결론적으로 클라우드, 빅데이터, 인공지능 기술에 대한 응용이 필수적임

[그림 4] 클라우드 기반의 ITOA 플랫폼 논리 모델


ITOA의 글로벌 현황

  • ITOA는 빅데이터의 처리와 분석을 기반으로 하고 있으며 세계 경제 포럼은 2012년 부각되는 10대 기술 중 첫 번째로 빅데이터 기술을 꼽았으며 지식경제부 R&D 전략기획단은 IT 10대 핵심기술 가운데 하나로 빅데이터를 선정하는 등 빅데이터는 세계적으로  주목 받고 있음
  • ‘가트너’의 보고서에서는 ITOA의 비즈니스 영향력을 ‘높음’으로 평가하고 수익 증대와 비용 감소의 가능성이 현저할 것으로 판단했으며, 2017년이 되면 15%의 기업이 비즈니스의 수행과 IT 운용을 위해 ITOA 기술을 사용할 것으로 예측함
  • 글로벌 컨설팅 기업인 Capgemini Consulting 은 2016년 Going Big: Why Companies Need to Focus on Operational Analytics 라는 보고서에서 운영 분석을 중시하는 기업들의 비율을 아래 [그림 5]와 같이 분석함

[그림 5] 운영 분석을 중시하는 기업들의 비율


우리의 대응은 무엇인가

  • 이미 많은 기업들이 성장 전략에 있어서 빅데이터가 중요하다는 점에는 동의하고 있지만 그 활용 방안이나 인프라 준비, 인력, 실질적 효과에 대한 우려로 ITOA 도입을 주저하고 있음

Joel George : IBM IT Operations Analytics Services Offering Manager

“기업들은 IT 운영 인프라를 좀더 면밀히 파악해 여러 부서/기관의 요구를 충족하고 인프라에 대한 투자를 최적화하고자 하는데 이를 위해 현재 기업들이 해결해야 하는 과제는 ▲복잡한 IT 인프라 ▲대량의 IT 운영 데이터가 사일로 단위로 분리 ▲기업 IT 환경의 빠른 변화 속도 등이다.”

  • 지금까지는 빅데이터의 처리에 중점을 둬왔지만, 실질적으로 중요한 것은 분석을 통한 인사이트 도출이나, 가트너는 2012년 포천 500대 기업 가운데 85%가 빅데이터 활용에 실패할 것이라고 냉정하게 예측하였음. IT 운영에서 발생하는 빅데이터를 분석하여 즉시 활용 가능한 정보와 통찰력을 뽑아내는 ITOA는 빅데이터 활용의 시작이며 그 분석 결과를 제대로 이해하고 이용할 수 있는 진정한 빅데이터 시대의 도래를 맞이할 준비가 필요한 시점임
  • ITOA의 흐름에 대비하기 위해서는 우선 1) 무엇을 어떤 목적으로 수집/분석/저장/예측 할 것인지에 대한 시나리오를 구체화 하고, 2) 다양한 로그 및 데이터를 수집할 수 있는 수집 체계 수립 및 각 수집 대상시스템이 수집이 용이한 구조를 가지도록 준비해야 하고, 3) 실시간 처리 기술 확보 및 활용 방안 수립, 4) 목적에 맞는 다양한 저장 기술 확보 및 활용 방안 수립, 5) OLAP 분석 및 배치 분석 기술 확보 및 활용 방안 수립, 5) 빅데이터에서 딥러닝을 위한 학습데이터를 추출하고, 5) 해당 학습데이터를 이용한 딥러닝 학습 프레임워크 준비, 6) 학습된 결과를 활용한 예측 프레임워크 활용 방안 수립 등에 이르는 과정이 전사적 관점에서 준비되어야 함.