Reasoning and Planning - Paper 발표(Let’s Verify Step by Step)
전체 슬라이드는 발표가 끝나고 올리는 걸로.이번 발표 주제는 Language model이 어떻게 reasoning과 planning을 하는 가에 대해서였다.지금까지는 Chain of Thought을 사용해 LM이 step by step으로 차근차근 inference를 진행하는 것으로 multi step reasoning이 필요한 고차원적 문제들에 대한 inference 성능을 높여왔다.나는 reasoning의 improvement 부분을 맡아 OpenAI에서 ICLR 2024에 발표한 Let’s Verify Step by Step이라는 논문을 리뷰했다. 본 논문이 최근 발표된 openAI의 최신 모델 openAI o1과 아주 밀접한 관계를 가지고 있어 흥미로웠다.openAI o1 모델 소개 - https..
2024.10.05