GPT(Generative Pre-trained Transformer)

🐱‍👤지식닌자 2023. 7. 12. 01:17

2023. 7. 12. 01:17

728x90

GPT(Generative Pre-trained Transformer)는 OpenAI에서 개발한 자연어 처리 모델 시리즈이다. Transformer 아키텍처를 기반으로 한 언어 모델로, 대규모 텍스트 데이터로 사전 학습되어 다양한 자연어 처리 작업에 사용된다.

GPT 시리즈는 텍스트의 다음 단어를 예측하고 생성하는 데 초점을 맞추어 학습되었다. 이러한 접근 방식은 텍스트의 문맥을 이해하고 의미 있는 문장을 생성하는 데 도움이 된다. GPT 모델은 단방향 Transformer 디코더 아키텍처를 사용하여 입력 시퀀스를 처리하고 생성한다.

가장 잘 알려진 모델로는 GPT-1, GPT-2, GPT-3이 있다. 이들은 각각 크기와 학습된 데이터의 양에서 차이가 있다.

GPT-1은 2018년에 발표된 첫 번째 GPT 모델로, 대규모 텍스트 데이터를 사용하여 학습되었다. GPT-2는 GPT-1보다 크기와 파라미터 수가 큰 모델로, 2019년에 발표되었다. GPT-2는 더 긴 텍스트 생성과 더 많은 창의성을 보여준다.

GPT-3는 2020년에 발표된 GPT 시리즈의 세 번째 모델로, 엄청난 규모와 파라미터 수를 가지고 있다. GPT-3는 자연어 처리 작업에서 상당한 성능을 발휘하며 문장 생성, 번역, 질의응답, 요약 등 다양한 작업에 사용된다.

728x90

'자연어 처리(NLP) 공부' 카테고리의 다른 글

<PAD> 토큰의 역할? (0)	2023.08.01
딥러닝에서 마스크(Mask)의 역할 (0)	2023.07.12
장기 의존성(long-range dependency)? (0)	2023.07.11
불용어(Stop words)는 항상 제거해야 하는가? (0)	2023.07.06
토크나이저(Tokenizer) 종류 (0)	2023.07.06

아는 것의 미학 🌼

GPT(Generative Pre-trained Transformer)

'자연어 처리(NLP) 공부' 카테고리의 다른 글

+ Recent posts

티스토리툴바