728x90
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv("AI_info_data.csv", encoding='cp949', index_col='고려사항별(1)') # 인공지능 관련 인력 채용 시 주요 고려사항(KOSIS)
print(df)

df.keys()
# Index(['1000인 이상', '100인 이상~1000인 미만', '10인 이상~100인 미만', '10인 미만', '전체'], dtype='object')

# (코랩)나눔글꼴 설치
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

df.plot(kind='bar')

df = df.drop(df.index[0])
print(df)

df.plot(kind='bar')

df.plot(kind='line')

 

df.plot(kind='hist')

df['1000인 이상'].plot(kind='pie')

df['100인 이상~1000인 미만'].plot(kind='pie')

df['10인 이상~100인 미만'].plot(kind='pie')

df['10인 미만'].plot(kind='pie')

pd.plotting.scatter_matrix(df)

pd.plotting.scatter_matrix(df, figsize=(15,15),
                           marker='o',
                           cmap='viridis',
                           alpha=0.8)

plt.plot(df)

※ plt.plot은 선 스타일이며 일반적으로 X좌표와 y좌표를 지정한다.

plt.plt(x, y)

plt.plot(df['x'], df['y']

plt.plot(df)
plt.xlabel('고려사항')
plt.ylabel('%')
plt.title('인공지능 관련 인력 채용 시 주요 고려사항')

상세하게 지정할 수 있는 옵션

Bar

df.plot(x='Category', y='Value', kind='bar', color='green', alpha=0.7, edgecolor='black', linewidth=1, width=0.6)

Hist

df.plot(y='Value', kind='hist', bins=20, color='purple', edgecolor='black', alpha=0.7)

Pie

df.plot(y='Value', kind='pie', labels=df['Category'], autopct='%1.1f%%', colors=['orange', 'lightblue', 'lightgreen', 'pink', 'yellow'], wedgeprops={'linewidth': 1, 'edgecolor': 'black'})

'%1.1f%%
: 파이 차트의 각 조각에 해당하는 비율을 소수점 1자리까지 표시하고, 그 뒤에 '%' 기호를 붙여서 백분율로 표시하라는 의미

 

 

+

df.plot(kind='bar')

- 이 코드는 pandas 라이브러리의 DataFrame 객체인 df에 대해 시각화를 수행하는 코드이다. kind='bar' 인자를 사용하여 막대 그래프를 그긴다. pandas의 기능을 활용하여 데이터프레임을 시각화하는 기능을 제공한다. 즉 matplotlib을 따로 임포트하지 않아도 되지만 추가적인 설정을 원하면 임포트해 주어야 한다.

plt.plot(x, y)

- 이 코드는 matplotlib 라이브러리의 plot 함수를 사용하여 시각화한다.

pd.plotting.scatter_matrix(df)

- 이 코드는 pandas 라이브러리의 plotting 모듈에 있는 scatter_matrix 함수를 사용한다. 이 함수는 산점도 행렬을 그려주는 기능을 제공한다. df 데이터프레임의 각 열을 x축과 y축으로 해서 산점도 그래프를 그리는 것이 특징이다.


728x90

+ Recent posts