[Kepler] 케플러로 택시 데이터 시각화하기
https://www.kaggle.com/competitions/nyc-taxi-trip-duration/data?select=test.zip
New York City Taxi Trip Duration
Share code and data to improve ride time predictions
www.kaggle.com
에서 데이터 구득
위 데이터 중 test.csv 다운받았음. 60만 행이 넘어, 이 중 1000개만 샘플링
ctrl + shift + P 하여 Geo: View Map 실행
Add Data > browse your files
업로드 완료
이 버튼을 눌러 3D모드로 전환해보자.
1. pickup 포인트 데이터 시각화
디폴트는 point인데, 이걸 hexbin으로 바꾸면
이렇게 된다.
Radius 옆 ...를 누르면 원하는 숫자로 바꿀 수 있음
Height 옆의 ...을 눌러 추가옵션 on
Multiplier 수치 높이고, passenger_count로 바꾸면
높이값이 부여됨
필터 메뉴, Add Filter
pickup_datetime 클릭
그럼 하단에 navigation 나옴
로켓 모양 누르면 속도 변경가능
이런 느낌 (배속함)
Heatmap
2. pick up -> drop off arc 시각화
위의 2개 off
arc만 on
너무 많으니, 어느정도 승객 수가 많은 것들만 필터링해보자.
필터 메뉴 > Add Filter > pickup datetime을 매우 좁게 설정
Color에서
색 적용하고
stroke 옆 ...를 눌러 옵션 모드 on하여
passenger count에 비례하게 굵기 바뀌도록 설정
확대하면 이렇다
3. line 시각화
line 제외 나머지 off
각종 옵션 적용한 결과