2024. 1. 23. 09:39ㆍData_Analyst
- 데이터 타입에 따른 시각화 유형
- 단일변수
데이터 타입 | 유형 |
수치형 | 확률분포 또는 히스토그램 |
범주형 | 빈도 수 그래프 (Bar / Pie Chart) |
- 다변수
데이터 타입 | 유형 |
Y: 연속 / X : 연속 | 산점도 / 회귀 그래프 / 히트맵 |
Y: 연속 / X: 범주 | 막대 그래프 / 상자그림 |
Y: 연속 / X: 시간(순서) | 선 그래프 / 포인트 그래프 |
1. DDA: 묘사적 데이터 분석 -> Target (Y) / X : 시각화 (신뢰성)
1. EDA: 탐색적 데이터 분석 (데이터의 관계성 파악, 데이터 트랜드 파악)
-> 시각화(변수 간 분석, 다 변수)
2. CDA
3. PDA
라이브러리 사용
1. Matplot: 파이썬 그래프 시각화에서 가장 많이 사용됨
- 디테일한 옵션 저장 가능 (라벨 색상, 라벨 변경, 축 변경 등)
2. Seaborn: Matplot 라이브러리 기반으로 만들어짐
- 통계 전용 시각화
- Pandas 라이브러리와 호환성이 좋음 (Seabron만 사용해도 데이터분석을 용이하게 할 수 있음)
sns.countplot(data=df1, x='type_of_contract')
import matplotlib.pyplot as plt # pyplot: 파이썬 내에서 그래프 출력과 연관
import matplotlib as mpl # 한글폰트 설정, 글씨체 흐릿한거 뚜렷하게 생성해줌
mpl.rc('font', family='Malgun Gothic') # 그래프에 한글 폰트 적용(맑은 고딕)
sns.countplot(data=df1, x='type_of_contract')
plt.figure(figsize=[10,5]) # plt.figure(figsize[x축 사이즈, y축 사이즈])
sns.countplot(data=df1, x='product', hue='type_of_contract2')
plt.legend(loc='right') # plt.legend(loc='') 범례 위치 조정
plt.savefig('img1.png') # plt.savefig('ex.png')그래프 저장, pdf 형태로 저장도 가능
'Data_Analyst' 카테고리의 다른 글
Retention (0) | 2024.03.11 |
---|---|
RFM 고객 세분화 분석 (0) | 2024.02.16 |