공부기록
태블로 굿모닝 굿애프터눈(51) -Wikipedia 데이터 불러오기 본문
태블로 굿모닝 굿애프터눈 책을 참고하여 정리한 자료입니다.
오늘은 [chapter2. Google Spreadsheet로 웹 데이터 크롤링하기 - Wikipedia 데이터 불러오기]를 리뷰해보겠습니다.
데이터 원본:
https://en.wikipedia.org/wiki/List_of_current_Major_League_Baseball_stadiums
위 페이지는 테이블 형태로 되어있습니다. 그중 stadiums로 되어 있는 테이블 내의 30개 구장 리스트를 가져와 부가기능을 이용해 위도와 경도를 가져오겠습니다.
구글 로그인 후 새 스프레드 시트를 추가해줍니다.
스프레드시트 이름을 MLB Ballparks로 변경하고
a1셀에
=IMPORTHTML("https://en.wikipedia.org/wiki/List_of_current_Major_League_Baseball_stadiums","table",2)
를 입력합니다. 여기서 table은 table 형태의 데이터를 가져온다는 의미이고 2는 해당 웹 페이지 내 테이블 형태 중 2번째 테이블을 가져오겠다는 의미입니다.
엔터를 치면 다음과 같은 테이블을 가져오게 됩니다.
30개 구장의 위치를 태블로 데스크탑에서 맵 위에 표시하고자 구글 스프레드시트에 추가로 정보를 입력하고자 합니다.
먼저 B2부터 B31영역을 전체 드래그하고 복사한 후 K2에 값만 붙여넣기 합니다.
그리고 K1에 'Ballpark'라고 입력합니다.
부가기능 설치하기를 선택합니다.
'Geocode by Awesome Table'을 선택하고 'Start Geocoding'을 설치합니다.
l2를 선택하고 부가기능 - geocode by awesome table - start geocoding 을 선택합니다.
위와 같이 입력 후 geocode!버튼을 선택합니다.
그러면 위와 같이 ballpark에 있는 각 구장별 위도와 경도를 자동으로 불러오게 됩니다.
이제 태블로 데스크탑을 오픈합니다.
서버에 연결 - 자세히 - google스프레드시트를 선택합니다.
여기서 방금 생성한 'MLB Ballparks'를 선택 후 연결버튼을 누릅니다.
'[' 구분 기호를 기준으로 사용자 지정 분할 처리하겠습니다.
team필드에 상단에 세모옵션을 클릭 후 사용자 지정 분할을 선택하고 아래와 같이 설정합니다.
'Team-분할1' 필드를 더블 클륵 후 'Team ' 을 입력합니다.
team, loading...,name필드는 숨겨줍니다.
이제 시트로 이동합니다.
'latitude'와 'longitude'를 각각 더블클릭 하면 미국 지도에 점 하나가 생성되고
ballpark를 드래그해서 레이블 마크에 올리면 아래와 같이 구장이 모두 표기됩니다.
맵에 표시되는 미국 지명들이 한국어로 나오는것을 볼 수 있습니다.
이를 영어로 변환하겠습니다.
파일 - 통합 문서 로캘-자세히 - 영어(미국)을 선택합니다.
완성입니다.
'시각화 > 태블로 굿모닝 굿애프터눈' 카테고리의 다른 글
태블로 굿모닝 굿애프터눈(50) -Tableau Prep Builder로 데이터를 결합하기 (0) | 2021.07.11 |
---|---|
태블로 굿모닝 굿애프터눈(49) -태블로 prep을 통해 효율적으로 데이터 전처리하기 (0) | 2021.07.11 |
태블로 굿모닝 굿애프터눈(48) -데이터 해석기 사용 및 데이터 원본 필터 적용 (0) | 2021.07.11 |
태블로 굿모닝 굿애프터눈(47) - 사용자 지정 분할(Custom split) (0) | 2021.07.11 |
태블로 굿모닝 굿애프터눈(46) - 유니온(Union) (0) | 2021.07.04 |