[데이터웨어하우징] 데이터웨어하우징의 개념(정의)과 구조, OLAP

본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

* 데이터웨어하우징

Ⅰ. 정의

가. 주체지향성
나. 통합성
다. 비휘발성
라. 시계열성

Ⅱ. 데이터웨어하우징의 구조

가. 데이터웨어하우징의 4개 층
나. 데이터웨어하우스의 구조

Ⅲ. OLAP: On Line Analytical Processing

가. OLAP 시스템 분석 - OLAP Server와 웨어하우스
나. 데이터웨어하우스 디자인과 다차원 데이터베이스
1) 고전적 Entitiy-Relationship 모델링과 의사결정 지원
2) 독점적 다차원 데이터베이스
3) 차원 모델링

본문내용

또는 주문 라인 항목)이다. Entities는 결합의 복잡한 시리즈를 통해 밀접한 관계를 이룬다.
차원 모델링에서, 데이터 구조는 "측정(.measures)"과 "차원"을 나타내기 위해서 구조화된다. 측정은 탐지되는 숫자 데이터이다. 그것은 중앙의 "사실" 테이블에 저장되며. 차원은 각 트랜잭션을 정의하는 Natural Business Parameter이다. 차원은 중앙의 사실 테이블에 연결된 위성 테이블에 저장된다. 예를 들어, 전형적으로 마케팅 분석가가 다음과 같은 질문처럼 세일즈 데이터를 조사한다고 가정하자. "지난 6개월 동안 제품 라인 매니저별 세일즈" 또는, "1994년 4월의 계좌별 세일즈: 이 시나리오에서, 데이터 모델은 세일즈 정보를 추적하기 위한 하나의 사실 테이블로 구성될 것이다. 각 세일즈의 경우, 다른 변수 중에서 주문된 양을 저장하는 레코드, 가격 및 증가한 가격이 있을 것이다. 위성 또는 차원 테이블은 거래 정보, 제품 정보와 시간 정보를 포함할 것이다(세일즈 정보의 내추럴 차원). 이 시나리오에서, 모든 세일즈 레코드는 각각의 차원 테이블에 사실 테이블을 연결하는 키(key)를 소유하게 된다. 따라서 사실(fact) 테이블은 주문된 양, 세일즈, 거래 코드, 시간 코드 및 제품 코드를 저장할 것이다. 아래의 그림에서 사실 테이블은 일반적으로 완전 정규화 되고 테이블 내에 어떠한 중복된 데이터를 허용하지 않음을 보여준다.
실제 테이블로부터의 데이터 예시
차원테이블 내의 정보는 Standard Query Constrain뿐 아니라, 리포트 내에 Sub-total Break Points를 정의하는 데 사용된다. 전형적 Query는 "서부 지역에 있는 모든 소매점을 위한 월별 브랜드별에 의한 세일즈"를 요청한다. 이 경우, 세일즈는 실제(凉cf) 테이블에서 발견될 것이고, 이 테이블은 제품, 시간 그리고 지리적 차원 테이블에 연결되는 것이다.
차원은 종종 계층 구조화될 수도 있다. 계층(Hierarchy)이 " drill-down"과 "drill-up" 기능을 위한 구조를 제공하는 것처럼, 계층은 차원 모델링 에서 매우 중요하다. Drilling down은 데이터 세트의 좀더 상세한 뷰를 요구하는 과정이다. 예를 들어, query가 지역별 세일즈를 나타낸다고 하자. 한 지역에서 볼 때, 사용자는 그 지역에서의 세일즈가 주(state)에 의해 어떻게 분류되는가를 보기 위해서 drill down하기를 원할 것이다. drilling up은 데이터의 좀 더 요약된 뷰를 요구하는 것처럼 drilling down효과는 반대이다. 여기에 표시된 것처럼 모든 계층이 정확하게 다가가지(roll up) 않는다는 것을 주의해야 한다.
* 차원 요소: "차원 요소"는 차원 계층에서 특별한 레벨을 나타내는 데이터의 범주이다. 각 계층 레벨에는 한 개의 차원 요소가 있다. 따라서 제품 차원에는 3개의 차원 요소(제품, 제품 라인, 브랜드)가 있을 것이다. 이 모델에서, "브랜드"가 가장 상위의 레벨을 나타내는 반면, 차원 요소인 "제품"은 제품 차원에서 가장 낮은 계층 레벨을 나타낸다고 말할 것이다.
* 차원 속성: "차원 속성"은 특별한 차원 요소를 나타낸다. 예를 들어, "브랜드 매니저"는 차원 요소 "브랜드"를 나타내는 차원 속성일 것이다. '취향(flavor)"은 차원 요소인 '제품"을 나타내는 차원 속성일 것이다. 차원 속성은 사용자가 비계층적 데이터를 분류할 수 있도록 한다.
* 스타 도해(Star Schema): 차원 모델의 실제 구조는 "스타" 도해로 나타낸다. 스타 스키마는 분석중심의 다차원 데이터를 표현하기 위한 관계형 모델링기법으로 사실(.Fact) 테이블을 중심으로 여러 개의 차원 테이블이 뻗어 나오는 형태를 취하기 때문에 '스타 스키마'라 칭한다.
스타스키마 예시
위의 그림이 설명하는 것처럼 스타 도해는 차원 테이블로 둘러싸여 있는 스타 중심에 있는 실제(fact) 테이블로 나타날 수 있다. 사실(Fact)이란 매출액, 수량 등과 같이 실제 데이터 요소로 분석을 요하는 변수차원의 항목을 말하며, 차원이란 사실을 보는 관점을 말한다. 각 차원은 별도의 차원 테이블에 표현된다. 스타스키마는 이와 같이 사실테이블과 차원테이블을 사용함으로써 문제중심의 분석정보를 얻기 위해 필요한 조인의 횟수를 줄임으로써 질의에 신속히 반응할 수 있다.
* 차원 비정규화 : 스타 도해의 특성을 정의하는 것은 차원 테이블을 비정규화하는 것이다. 비정규화는 데이터가 디자인의 단순함과 성능을 위해서 각각의 테이블에 반복적으로 저장되는 데이터베이스 디자인 접근 방법이다. 따라서 차원 속성은 속성이 나타내는 차원 계층의 레벨에 따라 차원 테이블 속에 반복적으로 저장될 것이다.
예를 들어, 한 회사가 충 5개의 브랜드로 나타나는 100개의 개별 제품을 가지고 있다고 하자. 차원 테이블에 등록되어 있는 모든 제품을 위해서, 브랜드에 모든 속성이 있는 것처럼, 그와 연관된 브랜드도 역시 등록되어 있다. 브랜드 매니저 정보는 제품 차원에 있는 모든 레코드에 실제로 저장될 것이다. 브랜드명과 다른 모든 브랜드 속성들은 같다. 규정화된 데이터 모델에서, 브랜드 속성은 일단 브랜드 테이블에 통상적으로 저장될 것이고, 오직 그 테이블의 foreign key만 여러 번 참조될 것이다.
* 차원 모델링의 장점: 차원 모델링에서 스타 도해의 단순함은 다음의 4가지 중요한 장점을 보여준다.
첫째, 이것은 복잡한 다차원 데이터 구조를 매우 단순한 데이터 모델로 정의하도록 한다. 각 차원 내에 계층적 관계를 정의하기 쉽게 하고, 여러 테이블을 통해 연결하는 작업을 단순화한다.
둘째, Que카 수행해야 하는 실제 연결(초) 횟수를 감소시킨다. 이것은 굉장한 성능 향상을 가져온다.
셋째, 데이터 모델의 뷰를 단순화함으로써, 중요한 자원을 소모하며 부정확한 정보를 보여주는, 사용자의 부주의함으로 발생되는 잘못되고 장시간 수행되는 Query를 감소시킨다.
넷째, 데이터웨어하우스의 확장이 용이하고, 상대적으로는 관리가 쉽다. 스타 도해의 단순함과 강력한 차원 디자인은 데이터웨어하우스 성장에 융통성을 제공한다.

키워드

데이터웨어하우징, 데이터웨어하우징의 개념, 데이터웨어하주이 구조, 개념 정의 특징 특성, 문제점 개선과제, 의의 중요성 전망

목차

본문내용

키워드

추천자료