두 변수의 관계 시각화
산점도
- 각각의 사례를 점으로 표시
sns.scatterplot(x='mileage', y='price', data=df)
연식을 점의 크기로
sns.scatterplot(x='mileage', y='price', size='year', data=df)
추세선 추가
sns.lmplot(x='mileage', y='price', data=df)
등고선 추가
- 두 줄을 한 셀에
sns.scatterplot(x='mileage', y='price', data=df)
sns.kdeplot(x='mileage', y='price', data=df, color='lightgray', alpha=0.5)
선 그래프
sns.lineplot(x='x축_열이름', y='y축_열이름', data=데이터프레임)- 용도: 시간의 흐름에 따른 데이터 변화, 연속적인 값들의 추세 시각화
- 주요 인자:
x: x축에 해당하는 데이터프레임의 열 이름y: y축에 해당하는 데이터프레임의 열 이름data: 사용할 데이터프레임 객체hue: 특정 열의 값에 따라 선 색상 구분estimator: y값의 집계 방법 (기본값은 평균)
sns.lineplot(data=df, x='year', y='price') # 연도별 가격
sns.lineplot(data=df, x='year', y='price', hue='model') # 연도별 모델별 가격
sns.lineplot(data=df, x='year', y='price', estimator='std') # 연도별 표준편차
막대 그래프
sns.barplot(x='x축_범주형열', y='y축_수치형열', data=데이터프레임):- 범주형 데이터에 따른 수치형 데이터의 크기(예: 평균, 합계 등) 비교
sns.barplot(data=df, x='model', y='price') # 모델별 가격 평균
sns.countplot(x='x축_범주형열', data=데이터프레임):- 범주형 데이터의 각 항목별 빈도수(개수) 시각화 (y축 별도 지정 불필요)
sns.countplot(data=df, x='model') # 모델별 개수
퀴즈
사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.