[데이터 시각화] 서울시 강남구 주요소 한 눈에 보기


웹크롤링으로 수집된 데이터 시각화 하기


고객으로부터 강남구 소재의 모든 주유소 데이터를 전달 받고 이에 대한 시각화 요청을 받았습니다. 활용도와 가치를 높이기 위해 이 데이터를 시각화 해보았습니다.

고객으로부터 의뢰받은 강남구 주유소 데이터 (엑셀)

주유소 데이터를 지도 상에서 시각화하는 것이 필요하다는 생각이 들었습니다. 그런데, 데이터에 지리 정보 (X좌표, Y좌료)가 없네요. 네이버 지도 API를 결합시켜 데이터를 지도 상에서 표현해야 하겠습니다.


지도에 데이터를 표현하기 위한 작업


네이버 개발자 센터, 네이버 지도 API 페이지로 이동하여 아래와 같이 활용법을 숙지합니다.

네이버 지도 API

언어별 지도 API 호출 예제 (파이썬)

아래처럼 API 클라이언트 ID와 secret 키를 발급받습니다.

발급받은 API키를 바탕으로 x,y 좌표를 출력하는 함수를 만듭니다.


발급받은 애플리케이션 Client ID, Client Secret 키

지도API 호출 예제를 활용한 좌표 출력 함수

아래와 같이 원데이터에서 주소 데이터를 리스트로 받은 다음, 위에서 만든 함수를 활용하여

위도, 경도를 추출 한뒤 새로운 컬럼으로 만들어 추가합니다.


주소를 바탕으로 x,y 좌표(위도,경도)값을 받은뒤, 새로운 컬럼으로 추가하기

예제) folium 라이브러리를 활용한 지도 시각화

새롭게 정리한 데이터프레임을 바탕으로 드디어 지도에 표시하는 것이 가능합니다.


Folium 라이브러리의 활용


지도 시각화를 위한 라이브러리로는 folium을 활용하였습니다.

일반적으로 사용되는 구글맵(ggmap) 라이브러리에 대한 대안으로도 충분히 이용가능한 패키지입니다.


folium (github)


시각화 예시


제작한 소스를 토대로 아래와 같이 html 형식의 반응형 시각화 파일을 만들었습니다.

밋밋하던 엑셀 데이터 파일이 이렇게 한 눈에 들어오는 멋진 시각화 보고서로 바뀌었네요!


최종 출력 시각화 모습

선택한 조건으로 지도 조회

최종 완성된 시각화 파일은 html 파일로 아래와 같이 올려 두었습니다.


강남구 주유소 시각화 파일


아래의 기준으로 주유소가 지도 위에 보기 좋게 표현됩니다! 레이어를 선택하여 각 기준별 현황을 볼 수 있습니다.


- 휘발유 가격 상위 5 주유소, 휘발유 가격 하위 5 주유소

- 고급휘발유 취급 또는 비취급, 등유 취급 또는 비취급, 셀프 주유 가능 또는 불가능

- 차량 통행이 많은 세 도로인 봉은사로, 논현로, 언주로에 위치한 주유소

- 주유소 브랜드 (GS칼텍스, 현대오일뱅크, SK에너지, S-Oil) 별 분포

결론


지금까지 서울시 강남구 소재 주유소 현황 시각화 작업을 소개해드렸습니다.


데이터를 텍스트 형식으로 수집한 이후 시각화 작업까지 이루어진다면,

전달하고자 하는 데이터의 의미와 그 안에 담긴 인사이트를 훨씬

더 쉽게 얻을 수 있습니다.


조만간 또 다른 시각화 사례로 찾아뵙도록 하겠습니다!

========================= 스파이더킴 (www.spiderkim.com) 웹크롤링, 웹스크래핑, 웹데이터 수집, 빅데이터에서 최고의 서비스를 제공합니다. 지금 바로 홈페이지를 방문하셔서, 문의 요청해 주십시오!






조회 177회

​고객센터

Tel: 02-596-8900  Fax : 02-6930-5709

10시 - 오후 7시(토, 일요일 및 공휴일은 휴무)

개인정보관리책임자 : 황재준   상호 : 유펜솔루션   대표자 : 김재훈   사업자등록번호 : 426-86-00939
주소 : (본사)대전광역시 유성구 엑스포로446번길 38, 3층 302호 / (지사 및 연구소)서울시 성동구 연무장 15길 11, B동 2층
​ⓒ 2019 UpennSolution Co., Ltd. All rights reserved.