본문 바로가기

IT기술노트/빅데이터57

다차원질의 I. 데이터를 다양한 방식으로 분할 조회, 다차원질의의 개요 가. 다차원질의의 정의 - 사용자가 큐브의 일부분을 자신이 원하는 형태로 살펴보는 것처럼 데이터를 다양한 방식으로 분할하여 조회하는 기술 나. 다차원질의의 원칙 - Slice: 차원의 멤버나 그 이상의 멤버를 가지고 한 값을 선택 했을 때 나타나는 그 부분의 집합 - Dice: Slice된 특정한 항목에 대해 Drill Down, Roll Up등을 이용, 분석하는 프로세스 II. 다차원질의 기법 기법 설명 Drill Down - 요약된 형태의 데이터 수준에서 보다 구체적인 내용의 상세 데이터로 단계적으로 접근하는 분석 기법 Drill Up/Roll Up - Drill Down과 반대의 방향으로 사용자가 정보를 분석 Drill Across - 다.. 2021. 3. 1.
ODS(Operational Data Store) I. ODS의 개요 가. ODS(Operational Data Store)의 정의 - DW구축 시 소스 데이터에 일정한 가공 과정을 거쳐 작성되며 조직의 단기적 의사결정을 지원할 수 있고 DW 구축을 위한 중간 저장소 II. DW구성에서 ODS의 위치 2021. 3. 1.
Data Mart I. DW 데이터를 사용자에게 제공하기 위한 중/소규모 데이터베이스, Data Mart의 개요 가. Data Mart의 정의 - 데이터웨어하우스 환경에서 정의된 접근계층으로, 데이터웨어하우스에서 데이터를 꺼내 사용자에게 제공하는 중/소규모 데이터베이스 II. Data Mart의 구성 2021. 3. 1.
Star Schema, Snowflake Schema I. Star Schema, Snowflake Schema의 개요 가. Star Schema 구분 설명 개념 - Fact Table과 Dimension Table로 데이터를 분리하여 설계한 모델 장점 - 이해하기 쉽고, 계층구조 정의가 용이, 물리적인 조인수가 줄어든다. 단점 - 단일차원 테이블 à 설명 및 속성의 중복 저장, 상위 레벨에서의 조회 성능 저하 사례 나. Snowflake Schema 구분 설명 개념 - 스타 스키마의 차원 테이블을 완전 정규화 특성 - 정규화를 통해 차원 테이블에 중복된 데이터를 제거함으로 저장공간 줄임 - 사실 테이블에 비해 차원 테이블의 크기는 작기 때문에 그 효과는 적음 - 검색 속도를 저하시키기 때문에 사용에 주의 사례 2021. 3. 1.
DW 모델링(DW Modeling) I. DW 모델링의 개요 가. DW 모델링(DW Modeling)의 정의 - 대용량 데이터를 다양한 관점에서 빠른 성능으로 분석할 수 있도록 구성하는 데이터 분석 관점의 모델링 기법 나. DW 다차원 모델링의 특징 - 비즈니스 차원의 조직화, 사용자 접근 용이성 II. DW 다차원 모델링의 기법 및 구성요소 가. DW 다차원 모델링의 기법 구분 설명 Star Schema - 정규화 된 Fact Table을 중심으로 비정규화 된 Dimension Table들이 배치되는 형태의 모델링 기법 Snowflake Schema - 정규화 된 Fact Table을 중심으로 정규화 된 (제3정규형) Dimension Table들이 배치되는 형태의 모델링 기법 나. DW 다차원 모델링의 구성요소 구성요소 설명 사실 (F.. 2021. 3. 1.
DW(Data Warehouse) I. 기간시스템의 데이터 통합 저장소, DW의 개요 가. DW(Data Warehouse)의 정의 - 사용자의 의사결정에 도움을 주기 위하여, 기간시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터베이스 나. DW의 특징 - 비즈니스 사용자의 의사결정 지원, 신뢰할 수 잇는 하나의 버전 제공, 특정시점 기준 정확성 II. DW의 구성도 및 구성요소 가. DW의 구성도 나. DW의 구성요소 구성요소 설명 기법 ETT/ETL - 기간시스템에서 데이터를 추출하여 변환, 적재 - 온라인 방식, 오프라인 방식 ODS - ER 모델링으로 정의된 기간 시스템 저장소 - RDBMS Meta Data - DW에 보관된 데이터에 대한 정보 - 운영메타, 사용자메타 Data Mart - 중/소규.. 2021. 3. 1.
비즈니스 인텔리전스와 비즈니스 애널리틱스의 비교 I. 비즈니스 인텔리전스와 비즈니스 애널리틱스의 비교 가. 분석측면 구분 BI (Business Intelligence) BA (Business Analytics) 목적 - 과거의 성과를 측정하고 향후 비즈니스를 계획 - 비즈니스를 사전에 예측하고 최적화 수행 방식 - 사전에 정의된 지표를 중심으로 성과를 빠르게 이해하고 업무에 활용 - 특정 지표에 의존하기보다는 발생하는 원인을 심도 깊게 추적, 의사결정에 직접적인 적용 목표 활용 - 데이터 기반의 점용적 분석 - 선제적인 의사결정 지원 강조(문제해결) - BI의 진보된 개념 나. 구축측면 구분 BI (Business Intelligence) BA (Business Analytics) 개념 - 일관된 지표들을 중심으로 과거의 성과를 측정하고 향후 비즈니.. 2021. 3. 1.
비즈니스 애널리틱스(Business Analytics) I. 비즈니스 문제 해결을 위한 도구와 기술, 비즈니스 애널리틱스 개요 가. 비즈니스 애널리틱스(Business Analytics)의 정의 - 복잡한 비즈니스 관련 문제를 해결하기 위한 도구와 기술들 그리고 애널리틱스의 원칙들을 포함하는 애플리케이션 나. 비즈니스 애널리틱스의 등장배경 - 시장주도형 비즈니스 경쟁, 데이터 분석/활용 기술의 진화, 비즈니스 문화적 변화 다. 비즈니스 애널리틱스의 목적 - 고객관계관리, 거래모니터링, 마케팅, 비즈니스 시뮬레이션 II. 비즈니스 애널리틱스의 구성도 및 구성요소 가. 비즈니스 애널리틱스의 구성도 - 결과 반응적 의사결정의 한계를 갖는 Business Intelligence보다 발전 나. 비즈니스 애널리틱스의 구성요소 구분 구성요소 내용 관찰기반 정형리포트 - .. 2021. 3. 1.
코워드 분석 I. 코워드 분석의 개요 가. 코워드 분석의 정의 - 단어들간 상관관계에 주목하는 분석방법으로 문장 안에서 함께 사용되는 단어들의 규칙을 조사해서 문서의 주제와 관련된 핵심 개념이 무엇이고 이들의 관계가 어떤 지 식별하는 내용 분석 기법 나. 코워드 분석의 형태 II. 코워드 분석의 절차 절차 설명 자료수집 - 분석을 수행할 대상의 문헌 단위의 데이터 산정 유사도 행렬작성 - 단어의 동시 발생을 기초로 하는 동시 출현 행렬 작성 클러스터링 - 용어와 문헌들의 분류를 위해 클러스터링 시행 맵핑 - 대상 간의 유사성 측도에 따라서 대상을 다차원 공간 속에 배치 2021. 3. 1.
단어구름(Word Cloud) I. 텍스트 마이닝의 시각화 기법, 워드 클라우드의 개요 가. 단어구름(Word Cloud)의 정의 - 메타 데이터에서 얻어진 단어들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어놓아 웹사이트에 표시하는 방법 나. 단어구름의 형태 II. 단어구름의 단어 선택방법 및 측정방법 가. 단어구름의 단어 선택방법 선택방법 설명 단어동시 출현 - 여러 개의 단어가 한 개의 사진, URL, 기사 등을 묘사하기 위해 사용 단어동시 출현확률분포 - 모든 단어에서 발생하는 단어에 대한 확률분포를 이용한 단어선택방법 Kullback-Leibler Divergence - 단어의 동시 출현 확률 분포에 대한 동적인 변화의 측정 Freshness - 특정 단어가 사용된 최근 웹 리소스에 대해 각 시점 사이에 태그 동시.. 2021. 3. 1.
반응형