df['Sex'].map(sex_to_id)
feature['Sex'] = sex_to_id[sample['Sex']]
위의 두 코드는 기능적으로 동일한 역할을 한다. 둘 다 'Sex' 열의 값을 매핑된 식별자(ID)로 변환하여 저장하는 것을 목적으로 한다. 하지만 사용 방식과 문맥은 약간 다를 수 있다. 아래에서 두 가지 방식을 비교해 보자.
*sex_to_id = {"male": 0, "female": 1}
1. df['Sex'].map(sex_to_id)
- df['Sex']는 데이터프레임(df)에서 'Sex' 열을 선택하는 것을 의미한다.
- map() 함수는 해당 열의 각 값을 'sex_to_id' 딕셔너리에 매핑하여 변환한다.
- 결과적으로 매핑된 식별자(ID)로 변환된 열을 반환한다.
2. feature['Sex'] = sex_to_id[sample['Sex']]
- sample['Sex']는 'sample' 객체에서 'Sex' 열의 값을 가져오는 것을 의미한다.
- sex_to_id[sample['Sex']]는 'Sex' 열 값에 해당하는 식별자(ID)를 'sex_to_id' 딕셔너리에서 가져온다.
- 이 값을 'feature' 딕셔너리의 'Sex' 키에 할당하여 저장한다.
Name Sex
0 John male
1 Jane female
2 Alex male
3 Emma female
1. df['Sex'].map(sex_to_id)
0 0
1 1
2 0
3 1
Name: Sex, dtype: int64
2. feature['Sex'] = sex_to_id[sample['Sex']]
Name Sex
0 John 0
1 Jane 1
2 Alex 0
3 Emma 1
1번은 데이터프레임의 열에 대해 매핑 작업을 수행하고 결과를 반환하여 데이터를 분석하기 좋은 형태로 만들 때 사용하고, 2번은 특성 딕셔너리에 특정 키-값 쌍을 추가하는 방식으로 작동하여 새로운 데이터 프레임을 만들거나 업데이트하려는 목적으로 사용한다. 사용 목적과 결과 형태가 다르므로 두 방식은 다른 용도로 사용된다.
'AI' 카테고리의 다른 글
다운스트림 태스크(Downstream task) (0) | 2023.04.05 |
---|---|
자기 지도 학습(Self-Supervised Learning) (0) | 2023.04.05 |
Software 1.0 VS. Software 2.0 (0) | 2023.04.05 |
머신러닝(Machine Learning) 학습 방법, 종류 (0) | 2023.04.03 |
Traditional Algorithm VS. Machine Learning (0) | 2023.04.03 |