공부기록

태블로 굿모닝 굿애프터눈(51) -Wikipedia 데이터 불러오기 본문

시각화/태블로 굿모닝 굿애프터눈

태블로 굿모닝 굿애프터눈(51) -Wikipedia 데이터 불러오기

맘모스빵러버 2021. 7. 11. 17:45

태블로 굿모닝 굿애프터눈 책을 참고하여 정리한 자료입니다.

 

오늘은 [chapter2. Google Spreadsheet로 웹 데이터 크롤링하기 - Wikipedia 데이터 불러오기] 리뷰해보겠습니다.

 


데이터 원본:

https://en.wikipedia.org/wiki/List_of_current_Major_League_Baseball_stadiums

 

List of current Major League Baseball stadiums - Wikipedia

Wikimedia list article There are 30 stadiums in use by Major League Baseball (MLB) teams. The oldest ballpark is Fenway Park in Boston, home of the Boston Red Sox, which opened in 1912. The newest stadium is Globe Life Field in Arlington, Texas, home of th

en.wikipedia.org

 

 

위 페이지는 테이블 형태로 되어있습니다. 그중 stadiums로 되어 있는 테이블 내의 30개 구장 리스트를 가져와 부가기능을 이용해 위도와 경도를 가져오겠습니다.

 

구글 로그인 후 새 스프레드 시트를 추가해줍니다.

스프레드시트 이름을 MLB Ballparks로 변경하고

a1셀에 

=IMPORTHTML("https://en.wikipedia.org/wiki/List_of_current_Major_League_Baseball_stadiums","table",2)

를 입력합니다. 여기서 table은 table 형태의 데이터를 가져온다는 의미이고 2는 해당 웹 페이지 내 테이블 형태 중 2번째 테이블을 가져오겠다는 의미입니다. 

엔터를 치면 다음과 같은 테이블을 가져오게 됩니다. 

30개 구장의 위치를 태블로 데스크탑에서 맵 위에 표시하고자 구글 스프레드시트에 추가로 정보를 입력하고자 합니다. 

먼저 B2부터 B31영역을 전체 드래그하고 복사한 후 K2에 값만 붙여넣기 합니다. 

그리고 K1에 'Ballpark'라고 입력합니다. 

부가기능 설치하기를 선택합니다.

 

'Geocode by Awesome Table'을 선택하고 'Start Geocoding'을 설치합니다. 

l2를 선택하고 부가기능 - geocode by awesome table - start geocoding 을 선택합니다.

 

위와 같이 입력 후 geocode!버튼을 선택합니다.

그러면 위와 같이 ballpark에 있는 각 구장별 위도와 경도를 자동으로 불러오게 됩니다.

 

이제 태블로 데스크탑을 오픈합니다. 

서버에 연결 - 자세히 - google스프레드시트를 선택합니다.

여기서 방금 생성한 'MLB Ballparks'를 선택 후 연결버튼을 누릅니다. 

 

'[' 구분 기호를 기준으로 사용자 지정 분할 처리하겠습니다. 

team필드에 상단에 세모옵션을 클릭 후 사용자 지정 분할을 선택하고 아래와 같이 설정합니다.

 

'Team-분할1' 필드를 더블 클륵 후 'Team ' 을 입력합니다.

team, loading...,name필드는 숨겨줍니다.

이제 시트로 이동합니다.

'latitude'와 'longitude'를 각각 더블클릭 하면 미국 지도에 점 하나가 생성되고

ballpark를 드래그해서 레이블 마크에 올리면 아래와 같이 구장이 모두 표기됩니다.

맵에 표시되는 미국 지명들이 한국어로 나오는것을 볼 수 있습니다. 

이를 영어로 변환하겠습니다. 

파일 - 통합 문서 로캘-자세히 - 영어(미국)을 선택합니다.

완성입니다.