데이터 시각화

2024. 1. 23. 09:39Data_Analyst

- 데이터 타입에 따른 시각화 유형

- 단일변수

데이터 타입 유형
수치형 확률분포 또는 히스토그램
범주형 빈도 수 그래프 (Bar / Pie Chart)

- 다변수

데이터 타입 유형
Y: 연속 / X : 연속 산점도 / 회귀 그래프 / 히트맵
Y: 연속 / X: 범주 막대 그래프 / 상자그림
Y: 연속 / X: 시간(순서) 선 그래프 / 포인트 그래프

1. DDA: 묘사적 데이터 분석 -> Target (Y) / X : 시각화 (신뢰성)

1. EDA: 탐색적 데이터 분석 (데이터의 관계성 파악, 데이터 트랜드 파악)

-> 시각화(변수 간 분석, 다 변수)

2. CDA 

3. PDA

 

라이브러리 사용

1. Matplot:  파이썬 그래프 시각화에서 가장 많이 사용됨

- 디테일한 옵션 저장 가능 (라벨 색상, 라벨 변경, 축 변경 등)

2. Seaborn: Matplot 라이브러리 기반으로 만들어짐

- 통계 전용 시각화

- Pandas 라이브러리와 호환성이 좋음 (Seabron만 사용해도 데이터분석을 용이하게 할 수 있음)


sns.countplot(data=df1, x='type_of_contract')

x축에 type_of_contract를 설정했지만 한글 폰트 때문에 깨져서 나오는 현상

import matplotlib.pyplot as plt # pyplot: 파이썬 내에서 그래프 출력과 연관
import matplotlib as mpl # 한글폰트 설정, 글씨체 흐릿한거 뚜렷하게 생성해줌

mpl.rc('font', family='Malgun Gothic') # 그래프에 한글 폰트 적용(맑은 고딕)

sns.countplot(data=df1, x='type_of_contract') 

한글 폰트가 정상적으로 출력되어 있음을 볼 수 있다.

 

plt.figure(figsize=[10,5]) # plt.figure(figsize[x축 사이즈, y축 사이즈])
sns.countplot(data=df1, x='product', hue='type_of_contract2')
plt.legend(loc='right') # plt.legend(loc='') 범례 위치 조정
plt.savefig('img1.png') # plt.savefig('ex.png')그래프 저장, pdf 형태로 저장도 가능

'Data_Analyst' 카테고리의 다른 글

Retention  (0) 2024.03.11
RFM 고객 세분화 분석  (0) 2024.02.16