Skip to main content

두 변수의 관계 시각화

산점도

  • 각각의 사례를 점으로 표시
sns.scatterplot(x='mileage', y='price', data=df)

연식을 점의 크기로

sns.scatterplot(x='mileage', y='price', size='year', data=df)

추세선 추가

sns.lmplot(x='mileage', y='price', data=df)

등고선 추가

  • 두 줄을 한 셀에
sns.scatterplot(x='mileage', y='price', data=df)
sns.kdeplot(x='mileage', y='price', data=df, color='lightgray', alpha=0.5)

선 그래프

  • sns.lineplot(x='x축_열이름', y='y축_열이름', data=데이터프레임)
  • 용도: 시간의 흐름에 따른 데이터 변화, 연속적인 값들의 추세 시각화
  • 주요 인자:
    • x: x축에 해당하는 데이터프레임의 열 이름
    • y: y축에 해당하는 데이터프레임의 열 이름
    • data: 사용할 데이터프레임 객체
    • hue: 특정 열의 값에 따라 선 색상 구분
    • estimator: y값의 집계 방법 (기본값은 평균)
sns.lineplot(data=df, x='year', y='price') # 연도별 가격
sns.lineplot(data=df, x='year', y='price', hue='model') # 연도별 모델별 가격
sns.lineplot(data=df, x='year', y='price', estimator='std') # 연도별 표준편차

막대 그래프

  • sns.barplot(x='x축_범주형열', y='y축_수치형열', data=데이터프레임):
    • 범주형 데이터에 따른 수치형 데이터의 크기(예: 평균, 합계 등) 비교
sns.barplot(data=df, x='model', y='price') # 모델별 가격 평균
  • sns.countplot(x='x축_범주형열', data=데이터프레임):
    • 범주형 데이터의 각 항목별 빈도수(개수) 시각화 (y축 별도 지정 불필요)
sns.countplot(data=df, x='model') # 모델별 개수

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A