Decoder model vs Encoder-Decoder model RQ 발표

2024. 10. 5. 20:11AI/LLM

Research Question: Both Decoder and Encoder-Decoder models can be trained for generative LMs. Why did the latter lose popularity since T5?

결론: NLP의 everyday usage에는 decoder가 가진 장점(less resource, faster)가 좋다. 하지만 요즘의 multimodality를 강조한 LMM들은 decoder의 기존 pretrained 된 모델로 해결이 불가능해서, 동영상/사진/지식그래프 들의 embedding을 뽑아내는 encoder가 별도로 필요. 최근 구글 Gemini가 encoder-decoder 모델이다.

 

전체 슬라이드 주소: https://docs.google.com/presentation/d/e/2PACX-1vSnsDr0TNXWm5af78wurw8n9huI_K2VsD1Xa6Rq4F1y8noJoHUdbjXXwiRH9Bqg6QiqJWue1lGRgVqB/pub?start=false&loop=false&delayms=3000