728x90
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("AI_info_data.csv", encoding='cp949', index_col='고려사항별(1)') # 인공지능 관련 인력 채용 시 주요 고려사항(KOSIS)
print(df)
df.keys()
# Index(['1000인 이상', '100인 이상~1000인 미만', '10인 이상~100인 미만', '10인 미만', '전체'], dtype='object')
# (코랩)나눔글꼴 설치
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
df.plot(kind='bar')
df = df.drop(df.index[0])
print(df)
df.plot(kind='bar')
df.plot(kind='line')
df.plot(kind='hist')
df['1000인 이상'].plot(kind='pie')
df['100인 이상~1000인 미만'].plot(kind='pie')
df['10인 이상~100인 미만'].plot(kind='pie')
df['10인 미만'].plot(kind='pie')
pd.plotting.scatter_matrix(df)
pd.plotting.scatter_matrix(df, figsize=(15,15),
marker='o',
cmap='viridis',
alpha=0.8)
plt.plot(df)
※ plt.plot은 선 스타일이며 일반적으로 X좌표와 y좌표를 지정한다.
plt.plt(x, y)
plt.plot(df['x'], df['y']
plt.plot(df)
plt.xlabel('고려사항')
plt.ylabel('%')
plt.title('인공지능 관련 인력 채용 시 주요 고려사항')
상세하게 지정할 수 있는 옵션
Bar
df.plot(x='Category', y='Value', kind='bar', color='green', alpha=0.7, edgecolor='black', linewidth=1, width=0.6)
Hist
df.plot(y='Value', kind='hist', bins=20, color='purple', edgecolor='black', alpha=0.7)
Pie
df.plot(y='Value', kind='pie', labels=df['Category'], autopct='%1.1f%%', colors=['orange', 'lightblue', 'lightgreen', 'pink', 'yellow'], wedgeprops={'linewidth': 1, 'edgecolor': 'black'})
'%1.1f%%
: 파이 차트의 각 조각에 해당하는 비율을 소수점 1자리까지 표시하고, 그 뒤에 '%' 기호를 붙여서 백분율로 표시하라는 의미
+
df.plot(kind='bar')
- 이 코드는 pandas 라이브러리의 DataFrame 객체인 df에 대해 시각화를 수행하는 코드이다. kind='bar' 인자를 사용하여 막대 그래프를 그긴다. pandas의 기능을 활용하여 데이터프레임을 시각화하는 기능을 제공한다. 즉 matplotlib을 따로 임포트하지 않아도 되지만 추가적인 설정을 원하면 임포트해 주어야 한다.
plt.plot(x, y)
- 이 코드는 matplotlib 라이브러리의 plot 함수를 사용하여 시각화한다.
pd.plotting.scatter_matrix(df)
- 이 코드는 pandas 라이브러리의 plotting 모듈에 있는 scatter_matrix 함수를 사용한다. 이 함수는 산점도 행렬을 그려주는 기능을 제공한다. df 데이터프레임의 각 열을 x축과 y축으로 해서 산점도 그래프를 그리는 것이 특징이다.
728x90
'AI' 카테고리의 다른 글
KNN(K-Nearest Neighbors) 알고리즘 (0) | 2023.07.30 |
---|---|
Standard Scaling (0) | 2023.07.29 |
활성화 함수(activation function) (0) | 2023.07.03 |
인공 신경망(Artificial Neural Network, ANN) (0) | 2023.07.01 |
다중 선형 회귀(Multiple Linear Regression) VS. 다항 회귀(Polynomial Regression) (0) | 2023.06.30 |