1절 - 빅데이터 분석과 전략 인사이트

 

1. 빅데이터 회의론의 원인 및 진단

 1) 투자효과를 거두지 못했던 부정적 학습효과

 2) 빅데이터 성공사례가 기존 분석 프로젝트 사례에 포함

= 빅데이터에 포커스를 두는 것이 아닌, 분석을 통해 가치를 만드는 것에 집중해야 함

 

2. 빅데이터 분석의 핵심

 1) 관심의 증가

 2) 기존 프로세스의 자동화를 우선으로, 점차적으로 거지적이고 전략적인 가치를 이끌어 낼 수 있음 

 3) 'Big'이 아닌, 데이터 분석을 통해 어떤 시각과 통찰을 얻을 수 있느냐가 중요

 4) 전략과 비즈니스의 핵심 가치에 집중, 분석 평가지표를 개발하여 시장과 고객 변화에 대응할 수 있을 때, 비로소 빅데이터 분석은 가치를 가짐

 

3. 전략적 통찰

 1) 핵심적인 비즈니스 이슈에 집중하여 데이터를 분석하고 차별적인 전략으로 기업을 운영

 

4. 일차원적인 분석 vs 전략도출을 위한 가치기반 분석

산업 일차원적 분석 어플리케이션
금융 서비스 신용점수 산정, 사기 탐지, 가격 책정, 프로그램트레이딩, 클레임 분석, 고객 수익성 분석
소매업 판촉, 매대 관리, 수요 예측, 재고 보충, 가격 및 제조 최적화
제조업 공급사슬 최적화, 수요예측, 재고 보충, 보증서 분석, 맞춤형 상품 개발, 신상품 개발
운송업 일정 관리, 노선 배정, 수익 관리
헬스케어 약품 거래, 예비 진단, 질병 관리
병원 가격 책정, 고객 로열티, 수익 관리
에너지 트레이딩, 공급/수요 예측
커뮤니케이션 가격 계획 최적화, 고객 보유, 수요 예측, 생산능력 계획, 네트워크 최적화, 고객 수익성 관리
서비스 콜센터 직원관리, 서비스-수익 사슬 관리
정부 사기 탐지, 사례 관리, 범죄 방지, 수익 최적화
온라인 웹 매트릭스, 사이트 설계, 고객 추천
모든사업 성과관리

 1) 일차원적인 분석의 문제점

  - 환경 변화와 같은 예기치 못한 변화에 대한 대응이 어려워 새로운 기회를 포착하기 힘듦

 2) 전략도출 가치기반 분석

  - 전략적인 통찰력 창출에 포커스를 뒀을 때, 분석은 해당 사업에 중요한 기회를 발굴하고, 주요 경영진의 지원을 얻을 수 있음

  - 일차원적인 분석을 통한 경험을 쌓아, 분석의 활용 범위를 더 넓고 전략적으로 변화시킬 수 있도록 발전

  - 사업 성과를 견인하는 요소들과 차별화를 꾀할 기회에 대해 전략적 인사이트를 주는 가치기반 분석단계로 전진

 

2절 - 전략 인사이트 도출을 위한 필요 역량

 

1. 데이터 사이언스의 의미와 역할, 역량

 1) 의미

  - 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문지식을 종합한 학문

  - 다양한 유형의 데이터를 대상으로 분석 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함

 2) 역할

  - 비즈니스의 성과를 좌우하는 핵심 이슈에 답을 하고, 사업의 성과를 견인 (+소통력)

 3) 영역

IT 컨설팅 IT (데이터 처리와 관련된 IT 영역) - 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 데이터 웨어하우스, 고성능 컴퓨팅 등  
비즈니스 분석 (비즈니스 컨설팅 영역) - 커뮤니케이션, 프레젠테이션, 스토리텔링, 시각화 등 전략 컨설턴트
  Analytics (분석적 영역)

- 수학, 확률모델, 머신러닝, 분석학, 패턴 인식과 학습, 불확실성 모델링 등

 4) 역량

  - 복잡한 대용량 데이터를 구조화, 불완전한 데이터를 연결

  - 사소한 관계에서도 강력한 호기심을 가져, 문제의 이면을 파고들고, 질문을 찾아 검증 가능한 가설을 세우는 능력

  - 스토리텔링, 커뮤니케이션, 창의력, 열정, 직관력, 비판적 시각, 글쓰기 능력, 대화능력

  - Hard Skill

   -> 빅데이터에 대한 이론적 지식 : 관련 기법에 대한 이해와 방법론 습득

   -> 분석 기술에 대한 숙련 : 최적의 분석 설계 및 노하우 축적

  - Soft Skill

   -> 통찰력 있는 분석 : 창의적 사고, 호기심, 논리적 비판

   -> 설득력 있는 전달 : 스토리텔링, Visualization

   -> 다분야간 협력 : 커뮤니케이션

  - 통찰력있는 분석

   -> 직관과 전략, 경영 프레임워크 경험의 혼합

   -> 전체 업계의 방향과 고객이 중요시 하는 요소 이해

   -> 넓은 시야

  - 인문학의 열풍

외부환경의 변화 내용
컨버전스 -> 디버전스 단순세계화에서 복잡세계화로의 변화
생산 -> 서비스 비즈니스 중심이 제품 생산에서 서비스로 이동
생산 -> 시장창조 공급자 중심의 기술 경쟁에서 무형 자산의 경쟁으로 변화

 

3절 - 빅데이터 그리고 데이터 사이언스의 미래

 

1. 빅데이터 패러다임 변화

Digitalization Connection Agency
과거 현재 미래
- 아날로그 세상을 어떻게 효과적으로 디지털화하는 지가 과거의 가치 창출 원천

- 디지털화된 정보와 대상들은 서로 연결 시작

 - 연결을 더 효과적이고 효율적으로 제공하는가가 성공 요인

- 복잡한 연결을 얼마나 효과적이고 믿을 수 있게 관리하는가의 이슈

2. 데이터 사이언스의 한계

 1) 사람의 주관적인 해석이 개입되는 단계 불가피

 2) 분석 결과가 의미하는 바는 사람에 따라 다른 해석을 충분히 야기

 3) 정량적인 분석도 가정에 근거한다는 사실

= 인문학을 통한 데이터의 잠재력, 새로운 기회, 창조의 밑그림 도출

 

 

 

출처: 윤종식, 『데이터 분석 (준)전문가 가이드』, (주)데이터에듀(2020)

 

 

 

 

1절 - 빅데이터의 이해

 

1. 정의

 1) 좁은 범위 : 데이터 자체의 특성 변화에 초점

  - 3V (Volume, Variety, Velocity) -> 4V (Value, Visualization, Veraticy)

 2) 중간 점위 : 데이터의 처리, 분석 기술적 변화까지 포함

 3) 넓은 범위 : 인재, 조직 변화까지 포함

 

2. 빅데이터 정의의 범주 및 효과

데이터 변화 -> 기술 변화 -> 인재, 조직 변화

* 규모 (Volume)

* 형태 (Variety)

* 속도 (Valocity)

* 데이터 처리, 저장, 분석기술 및 아키텍쳐

* 클라우드 컴퓨팅 활용

* Data Scientist 같은 새로운 인재 필요

* 데이터 중심 조직

-> 기존 방식으로는 얻을 수 없는 통찰 및 가치 창출

-> 사업방식, 시장, 사회, 정부 등에서 변화와 혁신 주도

 

3. 출현 배경

 1) 산업계 - 고객 데이터 축적

  : 고객 데이터를 축적하여 데이터에 숨어있는 가치를 발굴

 2) 학계 - 거대 데이터 활용, 과학 확산

  : 아키텍쳐 및 통계 도구들이 발전

 3) 기술발전 - 관련기술의 발달

  : 디지털화, 저장 기술의 발달, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅

 

4. 빅데이터에 거는 기대

 1) 빅데이터를 비유하는 단어

  - 산업혁명의 석탄, 철

  - 21세기의 원유

  - 렌즈

  - 플랫폼

 2) 본질적인 변화

  (1) 사전처리 -> 사후처리

  (2) 표본조사 -> 전수조사

  (3) 질 -> 양

  (4) 인과관계 -> 상관관계

 

2절 - 빅데이터의 가치와 영향

 

1. 가치 산정이 어려운 이유

 1) 데이터 활용방식

 2) 새로운 가치 창출

 3) 분석 기술 발전

 

2. 영향 - 생활 전반의 스마트화

 1) 기업 - 혁신, 경쟁력 제고, 생산성 향상

 2) 정부 - 환경 탐색, 상황 분석, 미래 대응

 3) 개인 - 목적에 따른 활용

 

3절 - 비즈니스 모델

 

1. 활용 사례

 1) 기업 - 구글 검색 서비스, 월마트 고객 구매패턴 분석

 2) 정부 - 국가 안전 확보 활동을 위한 실시간 모니터링, 의료와 교육 개선

 3) 개인 - 사회관계망을 통한 선거활동, 음악 청취 기록 분석

 

2. 활용 기본 테크닉

 1) 연관규칙학습 - 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법

 2) 유형분석 - 문서를 분류하거나 조직을 그룹으로 나눌 때, 또는 온라인 수강생들을 특성에 따라 분류할 때 사용

 3) 유전자 알고리즘 - 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 매커니즘을 통해 점진적으로 진화시켜 나가는 방법

 4) 기계학습 - 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법

 5) 회귀분석 - 독립변수를 조작함에 따라, 종속변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용

 6) 감정분석 - 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석

 7) 사회관계망분석 - 특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악할 때 사용하고, 영향력있는 사람을 찾아낼 때 사용

 

4절 - 위기 요인과 통제 방안

 

1. 빅데이터 시대의 위기 요인

 1) 사생활 침해

 2) 책임 원칙 훼손

 3) 데이터 오용

 

2. 위기 요인에 따른 통제 방안

 1) 동의에서 책임으로

 2) 결과 기반 책임 원칙 고수

 3) 알고리즘 접근 허용

 

5절 - 미래의 빅데이터

 

1. 기본 3요소

 1) 데이터 : 모든 것의 데이터화

  - 특정 목적없이 축적된 데이터를 통한 창의적 분석, 새로운 결과 도출

 2) 기술 : 진화하는 알고리즘, 인공지능

  - 대용량의 데이터를 빠르게 처리하는 알고리즘, 스스로 학습하고 데이터를 처리하는 인공지능 

 3) 인력 : 데이터 사이언티스트, 알고리즈미스트

  - 빅데이터의 다각적 분석을 통한 인사이트 도출

 

 

 

 

출처: 윤종식, 『데이터 분석 (준)전문가 가이드』, (주)데이터에듀(2020)

 

1절 - 데이터와 정보

 

1. 정의

 1) dare(주다)의 과거분사형

 2) 관념, 추상적 -> 기술, 사실적 의미로 변화

 3) 추론과 추정의 근거를 이루는 사실

 4) 다른 객체와의 상호관계 속에서 가치를 갖는 것

 

2. 특성

 1) 존재적 특성 : 객관적 사실

 2) 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거

 

3. 유형

구분 형태 특징
정성적 데이터 언어, 문자 등 회사 매출이 증가함 등 저장, 검색, 분석에 많은 비용 소모가 많음
정량적 데이터 수치, 도형, 기호 등 나이, 몸무게, 주가 등 정형화가 된 데이터로 비용 소모가 적음

4. 지식경영의 핵심 이슈

 1) 암묵지 : 개인에게 축적된 내면화된 지식 -> 조직의 지식으로 공통화

 2) 형식지 : 언어, 기호, 숫자로 표출화된 지식 -> 개인의 지식으로 연결화

 

5. 데이터와 정보의 관계

 1) 데이터 : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실

 2) 정보 : 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것

 3) 지식 : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것

 4) 지혜 : 지식의 축적과 아이디어가 결합된 창의적인 산물

* 계층구조 : { 데이터 > 정보 > 지식 > 지혜 }

 

2절 - 데이터베이스의 정의와 특징

 

1 정의

 1) 1차 개념확대 : 정형데이터 관리

 2) 2차 개념확대 : 빅데이터의 출현으로 비정형데이터 포함

 

2. 특징

 1) 통합된 데이터 : 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미

 2) 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미

 3) 공용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미

 4) 변화되는 데이터 : 새로운 데이터의 삽입, 기존 데이터 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지해야 함

 

3. 다양한 측면에서의 특징

 1) 정보의 축적 및 전달

 2) 정보 이용

 3) 정보 관리

 4) 정보기술 발전

 5) 경제, 산업

 

3절 - 데이터베이스의 활용

 

1. 기업내부 데이터베이스

 1) OLTP (On-Line Transaction Processing)

  - 호스트 컴퓨터가 데이터베이스를 엑세스하고, 바로 처리 결과를 돌려보내는 형태

 2) OLAP (On-Line Analytical Processing)

  - 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술

 3) CRM (Customer Relationship Management)

  - 데이터베이스를 기초로 고객을 세부적으로 분류하여 효과적이고 효율적인 마케팅 전략을 개발하는 경영전반에 걸친 관리체계이며, 이에 정보기술이 밑받침되어 구성

 4) SCM (Supply Chain Management)

  - 부품 공급업체와 생산업체 그리고 고객에 이르기까지 거래관계에 있는 기업들 간 IT를 이용한 실시간 정보공유를 통해 시작이나 수요자들의 요구에 기민하게 대응토록 지원하는 것

 

2. 각 분야별 내부 데이터베이스 개념 및 소개

 1) 제조부문

  - ERP (Enterprise Resource Planning) : 경영자원(인사, 재무, 생산)을 하나의 통합 시스템으로 재구축하는 경영혁신기법을 의미

  - BI (Business Intelligence) : 데이터를 의사결정에 활용하는 일련의 프로세스를 의미

  - CRM

  - RTE (Real-Time Enterprise) : 회사의 전 부문(ERP, SCM, CRM 등)의 정보를 하나로 통합하여 관리하는 실시간 기업의 경영시스템을 의미

 2) 금융부문

  - EAI (Enterprise Application Integration) : 애플리케이션을 유기적으로 연동하여 필요한 정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 환경을 구현

  - EDW (Enterprise Data Warehouse) : 기업 리소스의 유기적 통합, 다원화된 관리 체계 정비, 데이터의 중복 방지 등을 위해 시스템을 재설계 하는 것

 3) 유통부문

  - KMS (Knowledge Management System) : 기업 경영을 지적 재산이라는 새로운 관점에서 새롭게 조명하는 접근방식

  - RFID (RF, Radio Frequency) : 주파수를 이용해 IF를 식별하는 시스템

 4) 사회기반구조 부문

  - EDI (Electronic Data Interchange) : 무역에 필요한 각종 서류를 표준화된 양식을 통해 거래처에 전송하는 시스템

  - VAN (Value Added Network) : 독자적인 네트워크로 각종 정보를 부호, 영상, 음성 등으로 교환하거나 정보를 축적하거나 또는 복수로 해서 전송하는 등 단순한 통신이 아닌 부가가치가 높은 서비스를 하는 것

  - CALS (Commerce At Light Speed) : 제품의 설계, 개발, 생산에서 유통, 폐기까지의 라이프 사이클 전반에 관련된 데이터를 통합, 공유, 교환할 수 있도록 한 경영통합정보시스템

 

 

 

* 출처 : 윤종식, 『데이터 분석 (준)전문가 가이드』, (주)데이터에듀(2020)

- 시행기관 : 한국데이터베이스진흥원

 

국가공인 데이터분석 준전문가 정의

 

ADsP 시험주요내용

 

ADsP 출제문항 및 과목별 세부 내용

 

ADsP 응시자격 및 합격기준
ADsP, ADP 시험일정

 

 

* 출처 : https://blog.naver.com/sbj622/221838444533

+ Recent posts