선 그래프(Line Plot)
질문
- 유료 구독자 수 변화 추이가 궁금해요!
- 2022년 대비 2023년의 상품 주문 판매량은 얼마나 증가했을까요?
- 매일 얼마나 많은 유저들이 우리 서비스를 이용할까요?
특징
- 간단하고 사용하기 쉽습니다.
- 시계열 데이터(시간에 따른 추이)를 시각화할 경우, 변화량과 트렌드를 한눈에 보기에 용이합니다.
- 연속적인 데이터에 사용하기 적합합니다. 연속형 데이터는 온도(25도, 30도), 시간(시, 분, 초)를 말합니다.
[실습] 에어비앤비 호스트 수 추이
연도별(2008-2016년) 에어비앤비 호스트 수 증가 추이를 선 그래프로 시각화해봅시다!
📍 요구 사항
✅ 열: Host Since(년)
✅ 행: 카운트(고유)(Host Id)
✅ 마크 레이블: 표시
✅ 색상: 그래프의 색상을 자유롭게 변경해주세요.
✅ 경로: 라인 패턴 유형을 2번째 선(--)으로 변경해주세요.
막대 그래프(Bar Plot)
질문
- 이번달 가장 많은 항공권이 예약된 해외 지역은 어디일까요?
- 퍼널별 전환율을 확인하고 싶어요.
- 카테고리별 상품 판매량을 비교하고 싶어요!
특징
- 간단하고 사용하기 쉽습니다.
- 범주 간의 차이나 분포를 시각적으로 이해하기 쉽습니다.
- 범주형 데이터(성별, 혈액형, 이름 등)에 사용하기 적합합니다.
[실습] 동네별 숙소 평균 가격
어느 동네가 숙소 평균 가격이 높을까요? neighborhood_cleansed별 평균 가격을 막대 그래프로 시각화 해봅시다!
📍 요구 사항
✅ 색상: 그래프의 색상과 테두리 색상을 자유롭게 변경해주세요.
✅ 정렬: 필드 평균(Price) 내림차순 기준 정렬
✅ 화면 맞춤: 높이 맞추기
맵 차트(Map Chart)
질문
- 밤 시간대(오후 11시-새벽 2시)에 택시 이용률이 가장 높은 서울 자치구는 어디일까요?
- 각 지역별 ATM 기기의 위치를 분석하여 어떤 지역이 기기 수가 많은지 부족한지 알고 싶어요.
- 성수동의 맛집 위치와 분포가 궁금합니다!
특징
- 지도를 활용해서 지리적 위치를 살펴볼 수 있습니다.
- 각 지역별 데이터의 분포 및 비중을 한눈에 확인할때 주로 사용합니다.
기능
- 뷰 툴바: 지도를 확대/축소해서 볼 수 있어요!
- 백그라운드 레이어: 투명도(%) 설정, 해안선, 건물 표시 등 지도 배경에 대한 다양한 기능이 있어요.
[실습] zipcode별 숙소 리뷰 평균 평점 분포
보스턴 지역에서 어느 구역이 숙소 리뷰 평균 평점이 가장 높을까요? 평균 평점 분포를 맵 차트로 시각화 해봅시다!
📍 요구 사항
✅ 세부정보: Zipcode
✅ 색상: 평균(Review Scores), 색상은 자유롭게 변경해주세요.
✅ 레이블 - Neighbourhood Cleansed: 폰트 볼드 처리, 폰트 크기(10pt) - 평균(Review Scores)
✅ 백그라운드 레이어: 투명도 100%
✅ 도구 설명 - 도구 설명 표시: 마우스 오버
파이 차트(Pie Chart)
질문
- 사용자 기기별(안드로이드, IOS, 태블릿) 앱 다운로드 비율이 궁금해요.
- 배달앱의 식사 시간별(점심 시간, 저녁 시간) 어떤 음식 카테고리 주문량 비중이 클까요?
- 멤버십 등급별(VVIP, VIP, 일반 고객) 매출 비중이 궁금해요!
특징
- 각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해할 수 있습니다.
- 데이터의 구성 비율과 분포를 한눈에 파악할 수 있습니다.
- 다양한 변수를 다루기에는 적합하지 않을 수 있습니다. 변수가 적을 때 직관적으로 사용하기 용이합니다.
[실습] 룸 타입별 비중
어떤 룸 타입이 가장 많은 비중을 차지하고 있을까요? 파이차트로 시각화 해봅시다!
📍 요구 사항
✅ 색상: Room Type 색상표에서 연한 번개를 선택해주세요.
✅ 각도: 카운트(고유)(Id)의 퀵테이블 구성 비율
✅ 측정값: 카운트(고유)(Id)
✅ 레이블: Room Type, 측정값을 순서대로 표시해주세요.
- Room Type: 폰트 볼드 처리, 폰트 크기(12pt), 사용자 지정 색상(#4B89DC)
- 측정값: 폰트 볼드 처리, 폰트 크기(10pt)
✅ 화면 맞춤: 전체 보기
트리맵 차트(Treemap Chart)
질문
- 카테고리의 지역별 매출 비율이 어떻게 될까요?
- 책의 종류(소설, 자기계발, 역사 등)별 지역별 서점 도서 매출이 궁금합니다.
특징
- 데이터를 계층적으로 표현하는데 사용됩니다.
- 카테고리별로 특정 데이터 집합이 전체 데이터에서 차지하는 비율을 면적으로 표현하여 카테고리별 구성 요소를 한눈에 파악할 수 있어요.
[실습] 가장 많이 리스트된 호스트 이름
가장 많이 리스트된 호스트는 누구일까요? 호스트의 숙소의 평균 가격과 숙소 가격 합계가 궁금해요.
숙소 가격 합계가 큰 순서대로 색상을 나타내주세요. 트리맵 차트로 시각화 해봅시다!
📍 요구 사항
✅ 열: 합계(Host Listings Count)
✅ 행: Host Name
✅ 레이블: Host Name, 평균(Price)
✅ 색상: 합계(Price), 색상 파란색-녹색 단일