728x90
df['Sex'].map(sex_to_id)
feature['Sex'] = sex_to_id[sample['Sex']]

 

위의 두 코드는 기능적으로 동일한 역할을 한다. 둘 다 'Sex' 열의 값을 매핑된 식별자(ID)로 변환하여 저장하는 것을 목적으로 한다. 하지만 사용 방식과 문맥은 약간 다를 수 있다. 아래에서 두 가지 방식을 비교해 보자.

 

 

*sex_to_id = {"male": 0, "female": 1}


1. df['Sex'].map(sex_to_id)
   - df['Sex']는 데이터프레임(df)에서 'Sex' 열을 선택하는 것을 의미한다.
   - map() 함수는 해당 열의 각 값을 'sex_to_id' 딕셔너리에 매핑하여 변환한다.
   - 결과적으로 매핑된 식별자(ID)로 변환된 열을 반환한다.

 


2. feature['Sex'] = sex_to_id[sample['Sex']]
   - sample['Sex']는 'sample' 객체에서 'Sex' 열의 값을 가져오는 것을 의미한다.
   - sex_to_id[sample['Sex']]는 'Sex' 열 값에 해당하는 식별자(ID)를 'sex_to_id' 딕셔너리에서 가져온다.
   - 이 값을 'feature' 딕셔너리의 'Sex' 키에 할당하여 저장한다.

 

   Name     Sex
0  John    male
1  Jane  female
2  Alex    male
3  Emma  female

 

1. df['Sex'].map(sex_to_id)

0 0
1 1
2 0
3 1
Name: Sex, dtype: int64

 

2. feature['Sex'] = sex_to_id[sample['Sex']]

Name Sex
0 John 0
1 Jane 1
2 Alex 0
3 Emma 1

 


1번은 데이터프레임의 열에 대해 매핑 작업을 수행하고 결과를 반환하여 데이터를 분석하기 좋은 형태로 만들 때 사용하고, 2번은 특성 딕셔너리에 특정 키-값 쌍을 추가하는 방식으로 작동하여 새로운 데이터 프레임을 만들거나 업데이트하려는 목적으로 사용한다. 사용 목적과 결과 형태가 다르므로 두 방식은 다른 용도로 사용된다.

 

 

728x90

+ Recent posts