Skip to main content

분포의 시각화

히스토그램 (histogram)

데이터를 구간별로 나눠, 각 구간의 사례 수를 막대그래프로 그린 것

import seaborn as sns # 시본 임포트
sns.histplot(
x='price', # x축(가로) 변수
data=df) # 데이터

막대기 수는 bins로 설정

sns.histplot(x='price', data=df, bins=30)

seaborn을 포함해 Python의 대다수 시각화 라이브러리는 matplotlib에 의존

import matplotlib.pyplot as plt

# 가로축 눈금을 100에서 2100까지 200 간격으로 설정
xs = list(range(100, 2100, 200))
sns.histplot(x='price', data=df, bins=xs)
plt.xticks(xs)

커널 밀도 추정 (kernel density estimation)

데이터 밀도 추정 기법 kde=True로 설정하면 데이터의 밀도를 추정하여 표시

sns.histplot(x='price', data=df, kde=True)

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A