공부기록

완전 노베이스 쌩초보 태블로 강의 기록 (4) 본문

시각화/인프런

완전 노베이스 쌩초보 태블로 강의 기록 (4)

맘모스빵러버 2021. 3. 28. 14:46

닉네임을 썩은감자로 바꾸지 않기 위해 이어서 강의를 정리해보겠습니다.

이번에 정리할 강의는 인프런의 "웰컴 투 태블로 월드" 6강으로 "상관 관계와 분포를 나타내는 차트" 에 관한 내용입니다

 

6강 정리)

먼저 profit과 discount를 행과 열 선반에 올려준 후 discount 우클릭 - 측정값 - 평균을 선택해줍니다. (default는 합계)

 

숫자의 의미는 이 회사에서 생산한 모든 profit은 약 286,397불이고 각 평균 16% 할인해주었다는 의미이다.

만약 고객별로 집계하고 싶다면

customer name을 마크로 끌어오고 원으로 형식을 바꾸면 위 사진과 같으 표시가 됩니다. (점 하나하나가 각각의 고객을 의미한다.)

원들이 너무 겹쳐서 잘 구별이 안될경우 투명도와 테두리를 조절하면 된다. 또한 만약 우리회사에 수익을 주는 고객과 그렇지 않은 고객을 색깔로 구분하고 싶다면 profit을 잡고 마크의 색상으로 드래그 앤드 드롭하면 된다.

 

극단에 있는 점들은 우클릭하여 제거할 수도 있다.

만약 추세선을 그리고 싶다면 분석탭 -> 추세선을 끌어다가 시트로 드래그앤드 드롭하면 원하는 형식의 추세선을 그릴 수 있다. 선형을 선택시 아래와 같은 결과를 얻을 수 있다 .

 

히스토그램으로 나타낼 경우 각 구간의 범위를 조정하고 싶다면?

해당 변수 우클릭 -> 편집-> 구간차원 편집에서 변경가능하다.

 

그럼 이제 Box-plot에 대해 알아보겠습니다. 

 

만약 합계를 제품의 서브카테고르별로 보고싶다면? sub-category를 마크의 세부정보로 드래그 앤드 드롭해줍니다!

 

그 후 차트의 형식을 원으로 바꾸고 표현방식을 box-plot으로 선택(밑에서 2번째 오른쪽 맨끝!)하면 box-plot을 그릴 수 있습니다.

차트를 간략히 해석해보면 1번이 profit 25%구간, 2번이 50%구간, 3번이 75%구간, 4번이 100%입니다!

만약 이러한 box-plot을 지역별로 나타내려면 어떻게 해야할까? 이제는 너무 익숙하게도 region을 열선반으로 드래그 앤드 드롭! 하면 간단하게 나타낼 수 있다. 

그런데 3번째 box-plot을 보면 범위 밖에 점들이 보인다. 이것은 outlier 즉 이상치이다. 통계적 개념이지만 간단히 설명하면 outlier란 아까 말씀드렸던 3지점에서 IQR(3지점 -1지점)*1.5보다 크거나 1지점에서 IQR*1.5보다 작은 경우를 의미한다. 

 

이렇게 6강 또한 마무리 되었습니다! 그래도 강의를 점점 듣다보니 태블로에 조금은 익숙해지고 어떠한 원리로 돌아가는 건지에 대하여 알것같은 느낌이 들고 있습니다ㅎㅎ! 앞으로도 아자아자!

 

강의 출처: www.inflearn.com/course/%ED%83%9C%EB%B8%94%EB%A1%9C%EA%B0%95%EC%A2%8C-1/lecture/27485?tab=note&time=0

 

웰컴 투 태블로 월드 - 인프런 | 학습 페이지

지식을 나누면 반드시 나에게 돌아옵니다. 인프런을 통해 나의 지식에 가치를 부여하세요.

www.inflearn.com