1과목. 빅데이터 분석 기획 2장. 데이터 분석 계획

2장. 데이터 분석 계획

  • 빅데이터 분석의 전체 프로세스를 이해해야 한다.

  • 특히 프로세스의 순서와 해당 단계에서의 목적을 분명히 이해해야 한다.

    핵심키워드

    • 분석 로드맵
    • 데이터 분석 모델링
    • 분석 요건 정의
    • 분석 작업 계획

01_분석 방안 수립

학습목표

데이터 분석을 위한 전 단계로 일종의 설계도를 그리는 과정이다. 데이터 분석 방안을 수립하는 과정에 대해 알아본다.

1. 분석 로드맵 설정

분석 로드맵 개념

  • 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용을 정렬함.

분석 로드맵 단계

단계 추진과제 추진목표
데이터 분석체계 도입 - 분석 기회 발굴
- 분석 과제 정의
- 로드맵 수립
- 비즈니스 약점이 무엇인지 식별
- 분석 과제를 정의하고 로드맵 수립
데이터 분석 유효성 검증 - 분석 알고리즘 설계
- 아키텍쳐 설계
- 분석 과제 파일럿 수행
- 분석 과제에 대한 파일럿 수행
- 유효성, 타당성을 검증
- 기술 실현 가능성을 검증
- 분석 알고리즘 및 아키텍처 설계
데이터 분석 확산 및 고도화 - 변화 관리
- 시스템구축
- 유관 시스템 고도화
- 검증된 분석 과제를 업무 프로세스에 내재화하기 위한 변화관리 실시
- 빅데이터 분석, 활용 시스템 구축 및 유관 시스템 고도화

빅데이터 분석 기획의 능력 단위 요소

분석 대상과 그 방법에 따른 4가지 분석 주제

5단계 빅데이터 분석 방법론

분석 과제 발굴 방법론 개념도

하향식 분석 과제 발굴 방법론

  • 분석 과제가 정해져 있고 이에 대한 해법을 찾기 위해 체계적으로 분석하는 방법

A. 문제 탐색 단계 : 문제를 탐색하는 단계로 크게 4가지 방법 중 하나 혹은 다수를 사용한다.

  1. 비즈니스 모델 탐색 기법

    업무, 제품, 고객 단위로 비즈니스 문제를 발굴하고, 이를 관리하는 규제와 감사 영역과 지원 인프라 영역에 대한 기회를 추가로 도출하는 탐색 기법이다.

  2. 분석 기회 발굴의 범위 확장

    기업과 산업 환경을 중심으로 거시적 관점, 경쟁자, 시장의 니즈, 역량 등 4가지 영역에 대해 비즈니스 문제를 발굴하는 방법이다.

  3. 외부 참조 모델 기반 문제 탐색

‘Quick&Easy’ 방식으로 산업별, 업무 서비스별 분석과제 POOL을 만들고, 이를 브레인스토밍 형태로 탐색하여 비즈니스 문제를 빠르게 발굴하는 방법이다.

  1. 분석 유스케이스

현재의 유사 및 동종 사례를 탐색하여 분석 유스케이스를 찾아내고, 이를 바탕으로 비즈니스 문제를 발굴하는 방법이다. 분석 유스케이스란 분석을 적용했을 때 업무 흐름을 개념적으로 설명한 것으로 프로세스 혁신 수단으로 활용되기도 한다.

B. 문제 정의 단계 : 앞서 1단계 문제 탐색 과정을 거쳐 비즈니스 문제가 식별되면 이를 데이터의 문제로 변환해야 한다. 즉, 데이터 분석에 관한 관점으로 전환하는 것이다. 예컨대 영업 부서에서 ‘최근 고객들의 불만이 높아지고 있다’는 비즈니스 문제가 식별됐다고 가정해 보자. 이를 데이터의 문제로 변환하면, ‘고객의 불만에 영향을 끼치는 요인이 무엇인지 분석하고, 그 요인과 고객 불만율에 대한 상관 및 예측 모델을 수립한다’ 정도로 바꿔볼 수 있다. 이것이 하향식 접근법의 2단계인 데이터로의 ‘문제 정의’ 단계다.

C. 해결방안 탐색 단계 : 먼저 기존 시스템으로 가능한지와 기업 자체의 역량이 있는지를 판단하여 다음 그림과 같이 4개의 해결 방안 중 하나를 선정한다.

D. 타당성 검토 : 하향식 접근법의 4번째 단계로 경제적 타당성과 데이터 및 기술적 타당성을 검토한다. 경제적 타당성 검토는 비용 대비 편익 분석 관점의 접근이 필요하며, 데이터 및 기술적 타당성 검토는 데이터 존재 여부, 분석 시스템 환경, 분석 역량 등에 대해 이루어져야 한다.

상향식 분석과제 발굴 방법론

  • 문제 정의 자체가 어려운 경우 데이터를 기반으로 문제를 지속적으로 개선하는 방식
  • 하향식 접근법의 한계를 극복하기 위한 분석 방법론으로써 디자인 사고 접근법을 사용하여 객관적인 데이터 그 자체를 관찰하고 실제적으로 행동에 옮겨 대상을 이해하는 방식을 적용함

가. 지도 · 비지도학습

나. 프로토타입 접근법(시행착오 해결법) : 상향식 접근법 중 하나로 시행착오 해결법이라고도 한다. 먼저 분석을 시도하고 그 결과를 확인하면서 조금씩 개선해나가는 방법.

포트폴리오 사분면(Quadrant) 분석을 활용한 분석 과제 우선순위 평가

우선순위 평가 기준을 난이도와 시급성을 동시에 고려해 판단한다. 우선 추진해야 하는 분석 과제와 단기적 또는 중장기적으로 추진해야 하는 분석과제 등 4가지 유형으로 구분해 분석 과제의 적용 우선순위를 결정한다. 다음 표에서 우선순위 평가 기준을 ‘시급성’에 둔다면 ‘ⅲ → ⅳ → ⅱ → ⅰ’ 순서로, ‘난이도’에 둔다면 ‘ⅲ → ⅰ → ⅱ → ⅳ’ 순서로 우선순위를 정할 수 있다.

데이터 분석 과제 추진 시 고려해야 하는 우선순위 평가 기준

구분 설명
시급성 목표 가치와 전략적 중요도에 부합하는지에 따른 시급성이 가장 중요한 기준
난이도 현재 기업의 분석 수준과 데이터를 생성, 저장, 가공, 분석하는 비용을 고려한 난이도는 중요한 기준

분석 로드맵 수립

2. 분석 요건 정의

분석 요건 정의 프로세스

3. 데이터 분석 모델링

02_분석 작업 계획

**학습목표**

데이터 분석 프로젝트를 기획하는 과정에 대해 학습한다. 전체의 흐름을 잘 이해하고 그다음에 암기하는 과정이 필요하다.

1. 데이터 확보 계획

데이터 획득 방안 수립

  • 내 · 외부의 다양한 시스템으로부터 정형/ 비정형/ 반정형 데이터를 수집하기 위한 구체적인 방안 수립
  • 내부 데이터 획득에는 부서 간 업무 협조와 개인정보보호 및 정보보안에 관련된 문제점을 사전에 점검하고, 외부 데이터 획득은 시스템 간 다양한 인터페이스 및 법적인 문제점을 고려하여 상세한 데이터 획득 계획을 수립함.

데이터 확보 계획 수립 절차

단계 업무 내용
목표 정의 - 성과 목표 정의
- 성과 지표 설정
- 비즈니스 도메인 특성 적용
- 구체적인 성과목표 정의
- 성과측정을 위한 지표 도출
요구사항 도출 데이터 및 기술 지원 등과 관련된 요구사항 도출 - 필요 데이터 확보 및 관리 계획
- 데이터 정제 수준, 데이터 저장 형태
- 기존 시스템 및 도구 활용 여부
- 플랫폼 구축 여부
예산안 수립 자원 및 예산 수립 - 데이터 확보, 구축, 정비, 관리 예산
계획 수립 - 인력 투입 방안
- 일정 관리
- 위험 및 품질관리
- 프로젝트 관리 계획 수립
  • 범위, 일정, 인력, 의사소통 방안 수립 |

2. NCS 기반 빅데이터 분석 절차 및 계획 수립

NCS 기반 빅데이터 분석 절차 및 계획 수립의 흐름

빅데이터 분석 절차

절차 설명
문제 인식 - 비즈니스 문제와 기회를 인식하고 분석 목적을 정의
연구조사 - 목적 달성을 위한 각종 문헌을 조사
- 조사 내용을 해결방안에 적용
- 중요 변화요소 조사
모형화 - 복잡한 문제를 분리하고 단순화하는 과정
자료 수집 - 데이터 수집, 변수 측정 과정
자료 분석 - 수집된 자료에서 의미 찾기
분석결과 공유 - 변수 간의 관련성을 포함한 분석결과 제시
- 의사결정자와 결과 공유
- 표, 그림, 차트를 활용하여 가시화

빅데이터 분석 작업 WBS 설정

단계 내용
데이터 분석 과제 정의 - 분석 목표 정의서를 기준으로 프로젝트 전체 일정에 맞게 사전 준비를 하는 단계
데이터 준비 및 탐색 - 데이터 처리 엔지니어와 데이터 분석가의 역할을 구분하여 세부 일정이 만들어지는 단계
- 분석 목표 정의서에 기재된 내용을 중심으로 데이터 처리 엔지니어가 필요 데이터를 수집하고 정리하는 일정 수립
- 데이터 분석가가 분석에 필요한 데이터들로부터 변수 후보를 탐색하고 최종적으로 도출하는 일정 수립
데이터 분석 모델링 및 검증 - 데이터 준비 및 탐색이 완료된 이후 데이터 분석 가설이 증명된 내용을 중심으로 데이터 분석 모델링을 진행하는 단계
산출물 정리 - 데이터 분석 단계별 산출물을 정리하고, 분석 모델링 과정에서 개발된 분석 스크립트 등을 정리하여 최종 산출물로 정리하는 단계

출처

Share