1절 - 빅데이터의 이해

 

1. 정의

 1) 좁은 범위 : 데이터 자체의 특성 변화에 초점

  - 3V (Volume, Variety, Velocity) -> 4V (Value, Visualization, Veraticy)

 2) 중간 점위 : 데이터의 처리, 분석 기술적 변화까지 포함

 3) 넓은 범위 : 인재, 조직 변화까지 포함

 

2. 빅데이터 정의의 범주 및 효과

데이터 변화 -> 기술 변화 -> 인재, 조직 변화

* 규모 (Volume)

* 형태 (Variety)

* 속도 (Valocity)

* 데이터 처리, 저장, 분석기술 및 아키텍쳐

* 클라우드 컴퓨팅 활용

* Data Scientist 같은 새로운 인재 필요

* 데이터 중심 조직

-> 기존 방식으로는 얻을 수 없는 통찰 및 가치 창출

-> 사업방식, 시장, 사회, 정부 등에서 변화와 혁신 주도

 

3. 출현 배경

 1) 산업계 - 고객 데이터 축적

  : 고객 데이터를 축적하여 데이터에 숨어있는 가치를 발굴

 2) 학계 - 거대 데이터 활용, 과학 확산

  : 아키텍쳐 및 통계 도구들이 발전

 3) 기술발전 - 관련기술의 발달

  : 디지털화, 저장 기술의 발달, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅

 

4. 빅데이터에 거는 기대

 1) 빅데이터를 비유하는 단어

  - 산업혁명의 석탄, 철

  - 21세기의 원유

  - 렌즈

  - 플랫폼

 2) 본질적인 변화

  (1) 사전처리 -> 사후처리

  (2) 표본조사 -> 전수조사

  (3) 질 -> 양

  (4) 인과관계 -> 상관관계

 

2절 - 빅데이터의 가치와 영향

 

1. 가치 산정이 어려운 이유

 1) 데이터 활용방식

 2) 새로운 가치 창출

 3) 분석 기술 발전

 

2. 영향 - 생활 전반의 스마트화

 1) 기업 - 혁신, 경쟁력 제고, 생산성 향상

 2) 정부 - 환경 탐색, 상황 분석, 미래 대응

 3) 개인 - 목적에 따른 활용

 

3절 - 비즈니스 모델

 

1. 활용 사례

 1) 기업 - 구글 검색 서비스, 월마트 고객 구매패턴 분석

 2) 정부 - 국가 안전 확보 활동을 위한 실시간 모니터링, 의료와 교육 개선

 3) 개인 - 사회관계망을 통한 선거활동, 음악 청취 기록 분석

 

2. 활용 기본 테크닉

 1) 연관규칙학습 - 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법

 2) 유형분석 - 문서를 분류하거나 조직을 그룹으로 나눌 때, 또는 온라인 수강생들을 특성에 따라 분류할 때 사용

 3) 유전자 알고리즘 - 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 매커니즘을 통해 점진적으로 진화시켜 나가는 방법

 4) 기계학습 - 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법

 5) 회귀분석 - 독립변수를 조작함에 따라, 종속변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용

 6) 감정분석 - 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석

 7) 사회관계망분석 - 특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악할 때 사용하고, 영향력있는 사람을 찾아낼 때 사용

 

4절 - 위기 요인과 통제 방안

 

1. 빅데이터 시대의 위기 요인

 1) 사생활 침해

 2) 책임 원칙 훼손

 3) 데이터 오용

 

2. 위기 요인에 따른 통제 방안

 1) 동의에서 책임으로

 2) 결과 기반 책임 원칙 고수

 3) 알고리즘 접근 허용

 

5절 - 미래의 빅데이터

 

1. 기본 3요소

 1) 데이터 : 모든 것의 데이터화

  - 특정 목적없이 축적된 데이터를 통한 창의적 분석, 새로운 결과 도출

 2) 기술 : 진화하는 알고리즘, 인공지능

  - 대용량의 데이터를 빠르게 처리하는 알고리즘, 스스로 학습하고 데이터를 처리하는 인공지능 

 3) 인력 : 데이터 사이언티스트, 알고리즈미스트

  - 빅데이터의 다각적 분석을 통한 인사이트 도출

 

 

 

 

출처: 윤종식, 『데이터 분석 (준)전문가 가이드』, (주)데이터에듀(2020)

 

1절 - 데이터와 정보

 

1. 정의

 1) dare(주다)의 과거분사형

 2) 관념, 추상적 -> 기술, 사실적 의미로 변화

 3) 추론과 추정의 근거를 이루는 사실

 4) 다른 객체와의 상호관계 속에서 가치를 갖는 것

 

2. 특성

 1) 존재적 특성 : 객관적 사실

 2) 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거

 

3. 유형

구분 형태 특징
정성적 데이터 언어, 문자 등 회사 매출이 증가함 등 저장, 검색, 분석에 많은 비용 소모가 많음
정량적 데이터 수치, 도형, 기호 등 나이, 몸무게, 주가 등 정형화가 된 데이터로 비용 소모가 적음

4. 지식경영의 핵심 이슈

 1) 암묵지 : 개인에게 축적된 내면화된 지식 -> 조직의 지식으로 공통화

 2) 형식지 : 언어, 기호, 숫자로 표출화된 지식 -> 개인의 지식으로 연결화

 

5. 데이터와 정보의 관계

 1) 데이터 : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실

 2) 정보 : 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것

 3) 지식 : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것

 4) 지혜 : 지식의 축적과 아이디어가 결합된 창의적인 산물

* 계층구조 : { 데이터 > 정보 > 지식 > 지혜 }

 

2절 - 데이터베이스의 정의와 특징

 

1 정의

 1) 1차 개념확대 : 정형데이터 관리

 2) 2차 개념확대 : 빅데이터의 출현으로 비정형데이터 포함

 

2. 특징

 1) 통합된 데이터 : 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미

 2) 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미

 3) 공용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미

 4) 변화되는 데이터 : 새로운 데이터의 삽입, 기존 데이터 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지해야 함

 

3. 다양한 측면에서의 특징

 1) 정보의 축적 및 전달

 2) 정보 이용

 3) 정보 관리

 4) 정보기술 발전

 5) 경제, 산업

 

3절 - 데이터베이스의 활용

 

1. 기업내부 데이터베이스

 1) OLTP (On-Line Transaction Processing)

  - 호스트 컴퓨터가 데이터베이스를 엑세스하고, 바로 처리 결과를 돌려보내는 형태

 2) OLAP (On-Line Analytical Processing)

  - 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술

 3) CRM (Customer Relationship Management)

  - 데이터베이스를 기초로 고객을 세부적으로 분류하여 효과적이고 효율적인 마케팅 전략을 개발하는 경영전반에 걸친 관리체계이며, 이에 정보기술이 밑받침되어 구성

 4) SCM (Supply Chain Management)

  - 부품 공급업체와 생산업체 그리고 고객에 이르기까지 거래관계에 있는 기업들 간 IT를 이용한 실시간 정보공유를 통해 시작이나 수요자들의 요구에 기민하게 대응토록 지원하는 것

 

2. 각 분야별 내부 데이터베이스 개념 및 소개

 1) 제조부문

  - ERP (Enterprise Resource Planning) : 경영자원(인사, 재무, 생산)을 하나의 통합 시스템으로 재구축하는 경영혁신기법을 의미

  - BI (Business Intelligence) : 데이터를 의사결정에 활용하는 일련의 프로세스를 의미

  - CRM

  - RTE (Real-Time Enterprise) : 회사의 전 부문(ERP, SCM, CRM 등)의 정보를 하나로 통합하여 관리하는 실시간 기업의 경영시스템을 의미

 2) 금융부문

  - EAI (Enterprise Application Integration) : 애플리케이션을 유기적으로 연동하여 필요한 정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 환경을 구현

  - EDW (Enterprise Data Warehouse) : 기업 리소스의 유기적 통합, 다원화된 관리 체계 정비, 데이터의 중복 방지 등을 위해 시스템을 재설계 하는 것

 3) 유통부문

  - KMS (Knowledge Management System) : 기업 경영을 지적 재산이라는 새로운 관점에서 새롭게 조명하는 접근방식

  - RFID (RF, Radio Frequency) : 주파수를 이용해 IF를 식별하는 시스템

 4) 사회기반구조 부문

  - EDI (Electronic Data Interchange) : 무역에 필요한 각종 서류를 표준화된 양식을 통해 거래처에 전송하는 시스템

  - VAN (Value Added Network) : 독자적인 네트워크로 각종 정보를 부호, 영상, 음성 등으로 교환하거나 정보를 축적하거나 또는 복수로 해서 전송하는 등 단순한 통신이 아닌 부가가치가 높은 서비스를 하는 것

  - CALS (Commerce At Light Speed) : 제품의 설계, 개발, 생산에서 유통, 폐기까지의 라이프 사이클 전반에 관련된 데이터를 통합, 공유, 교환할 수 있도록 한 경영통합정보시스템

 

 

 

* 출처 : 윤종식, 『데이터 분석 (준)전문가 가이드』, (주)데이터에듀(2020)

- 시행기관 : 한국데이터베이스진흥원

 

국가공인 데이터분석 준전문가 정의

 

ADsP 시험주요내용

 

ADsP 출제문항 및 과목별 세부 내용

 

ADsP 응시자격 및 합격기준
ADsP, ADP 시험일정

 

 

* 출처 : https://blog.naver.com/sbj622/221838444533

+ Recent posts