Post

NLP 5주차

GPT의 언어 모델 특징

  • GPT는 확률적 시스템으로, 같은 프롬프트에 대한 다양한 답변을 생성할 수 있다.
  • 특정 프롬프트로 작은 시를 작성할 수 있으며, 이를 통해 AI의 중요성을 강조할 수 있다.
  • 사용자가 제시한 프롬프트에 따라 순차적으로 단어를 생성한다.
  • 여러 예시들이 존재하며, 많은 사용자들이 재미있는 프롬프트를 만들어 냈다.
  • GPT는 언어모델로, 주어진 입력의 시퀀스를 완성하는 방식으로 작동한다.

Chat GPT와 같은 기능을 갖춘, 트랜스포머 기반의 언어 모델을 훈련하는 것에 초점

  • “Attention is All You Need” 논문에서 소개된 트랜스포머 아키텍처가 Chat GPT의 주요 구성 요소이다.
  • Chat GPT는 트랜스포머 기반으로, 실질적인 작업을 처리하는데 사용된다.
  • 트랜스포머 아키텍처는 기계 번역을 위해 제안된 것이지만, 이후 다양한 인공지능 분야에도 활용되었다.
  • 이 때문에 Chat GPT에도 트랜스포머 아키텍처가 복사되어 사용되었다.
  • 하지만 이번 프로젝트에서는 Chat GPT와 같은 규모의 영향력을 재생산하기 어려우므로, 트랜스포머 기반 언어 모델을 캐릭터 수준으로 훈련할 예정이다.
This post is licensed under CC BY 4.0 by the author.

Trending Tags