한 변수의 분포 시각화

Python 데이터 시각화

import matplotlib.pyplot as plt # matplotlib의 pyplot 모듈
import seaborn as sns # seaborn 라이브러리

import seaborn as sns

histplot 함수를 이용해서 히스토그램 그리기
- 데이터는 df로 지정
- x축(가로)은 price로 지정
- 'price'는 변수가 아닌 df의 한 열 이름이므로 따옴표를 쳐서 문자열로 표시

sns.histplot(x='price', data=df)

sns.kdeplot(x='price', data=df)

sns.kdeplot(x='price', data=df)
sns.rugplot(x='price', data=df)

sns.histplot(x='price', data=df, kde=True)

sns.ecdfplot(data=df, x="price")

sns.kdeplot(data=df, x="price", hue="model") # 왼쪽
sns.ecdfplot(data=df, x="price", hue="model") # 오른쪽

sns.boxplot(x='범주형열', y='숫자형열', data=데이터프레임) 또는 sns.boxplot(data=데이터프레임의_숫자형열):
데이터의 사분위수, 중앙값, 이상치 등을 상자 그림으로 표현
범주별 데이터 분포 비교에 유용

sns.boxplot(data=df, y='price') # 가격 분포
sns.boxplot(data=df, x='model', y='price') # 모델별 가격 분포

사용자 정보 입력

퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

이름

별명

소속