공부기록

완전 노베이스 쌩초보 태블로 강의 기록 (8) 본문

시각화/인프런

완전 노베이스 쌩초보 태블로 강의 기록 (8)

맘모스빵러버 2021. 4. 4. 12:26

오늘 게시물은 10강 Level of Detail 입니다!!

 

강의 출처: www.inflearn.com/course/%ED%83%9C%EB%B8%94%EB%A1%9C%EA%B0%95%EC%A2%8C-1/lecture/27489?tab=note

 

웰컴 투 태블로 월드 - 인프런 | 학습 페이지

지식을 나누면 반드시 나에게 돌아옵니다. 인프런을 통해 나의 지식에 가치를 부여하세요....

www.inflearn.com

이번 9강은 3개의 모듈로 구성되어 있다.

- 첫번째 모듈에서는 태블로와 엑셀의 차이점을 몇 가지 짚어보았고,

- 두번째 모듈에서는 태블로가 작동하는 핵심적인 원리인 Level of Detail의 개념을 살펴보았으며,

- 세번째 모듈에서는 이 개념을 바탕으로 태블로에서 데이터를 탐색하는 기법을 몇 가지 예시를 통해 실습해봅니다.

 

1. 태블로와 엑셀의 차이점

 

특징을 정리해 보자면 ...

태블로: 데이터를 시각화

엑셀: 그자체가 데이터 원본, 엑셀은 스프레드시트에 일종

 

강의에서 태블로와 엑셀이 무엇이 좋다, 나쁘다라고는 할 수 없지만..! 데이터를 탐색하는 목적이 quick summary라면??

taebleau가 우수하다!

 

그렇다면 태블로와 엑셀은 어떻게 다른가??

 

1. 표현방식

태블로는 차트나 그래프 중심인 방면에 엑셀은 테이블, 표 중심이다.

 

2. 편집방식

태블로에서는 그 어떠한 경우에도 원본 편집불가하다. 그러내 엑셀은 데이터 원본 그자체이면서 스프레드 시트이기 때문에 기본적으로 데이터 원본 편집이 가능하다. 

 

3. 계산방식

태블로는 측정값을 집계해서 보여준다. 엑셀같은 경우에는 있는 그대로 row level에서 보여준다. 

태블로는 큰 덩어리를 자르는 방식으로 dril down하는 방식으로 데이터를 보여준다. 엑셀은 조건에 맞는 것들을 합치는 방식으로 보여준다. 

 

2. level of detail의 개념

태블로는 집계하기 때문에 summary가 유리하다. detail을 먼저 보여주지 않는다! 큰거를 먼저 보여주고 내려간다.

태블로는 항상 집계하기 떄문에, 데이터를 어느 수준의 depth, detail, granularity로 썰어서 볼지 결정하여야 한다. 

무를 어떻게 썰지 결정하는 요소는 무엇일까?? 

무를 가지고 뭘만들지가 그것을 결정하는 요소이다. 즉 우리가 만들 화면을 누가 볼것인가? 를 고려해야한다.

 

더불어 태블로에서 데이터를 계속 썰고 썰고 썰어서 더이상 쪼개지지 않는 데이터가 남았다면 그 데이터는 무엇을 의미할까?

 

그 의미를 찾기 위해서, 전체 데이터셋을 한 줄 한 줄로 나누어 줄 수 있는 필드 또는 필드의 조합을 찾아야 한다. 

그래야지 한줄 한줄의 데이터가 어떤 의미인지 알 수 있을 것이다. 

 

3. 실습

1) 단 하나의 필드로 데이터셋의 최종 디테일까지 분기할 수 있는 경우 

(예를 들어 사람의 이름으로 데이터를 분기할경우 (동명이인이 없다면))

 

2) 몇 개의 필드를 조합하여 데이터셋의 최종 디테일까지 분기할 수 있는 경우

이런식으로 몇개의 필드를 조합하여 최종 디테일까지 분기할 수 있다. 

 

3) 어떤 필드를 조합하더라도, 데이터셋의 최종 디테일까지 분기할 수 었는 경우

 

만약 리뷰가 가장 많은 app을 찾아달라는 요청에

그냥 이렇게 보여준다면 데이터에 대한 이해가 부족한것!

그 이유는 

이처럼 인스타그램 데이터를 살펴보았을때 무슨 이유인지는 모르지만 크롤러가 4번 돌았는데 4번돈 결과를 합계하여 나타냈기 때문이다. 

그렇기 때문에 위와 같은 변수를 만들어서 그래프를 그려주면

(해당 변수는 중복된 크롤링 결과중 가장 많은 리뷰수 만 가져오는것)

이렇게 결과가 바뀐것을 알 수 있다!!

 

태블로의 최대강점은 빠르게 요약한다는 점이다. (detail을 배제하고 집계를 먼저 보여주기 때문)

데이터 한 줄 한 줄의 의미 파악이 무엇보다 중요하다!