In Self-Refine, a single frozen LLM acts as generator, critic, and rewriter in a prompt-only loop, and the paper reports...

In Self-Refine, a single frozen LLM acts as generator, critic, and rewriter in a prompt-only loop, and the paper reports about 20 points of average lift across seven tasks without any training, RL, or external signal. The gains vary widely by task: small on math reasoning, but large on dialogue and constrained generation, where what counts as "good" is hardest to define from a one-line critique.https://benjaminhan.net/posts/20260516-self-refine/?utm_source=mastodon&utm_medium=social#SelfRefine #LLMs #AI #Reasoning #Metacognition

Read Original

Related

Mastodon discussion 23m ago

현대차 웹사이트가 AI로 달라졌다현대차그룹이 공식 웹사이트에 AI 기반 정보 경험 기능을 도입했습니다. 긴 기사를 요약하고, 원하는 정보를 찾아주며, 음성으로 읽어주는 세 가지 핵심 기능으로 정보 소비 방식이 달라집...

현대차 웹사이트가 AI로 달라졌다현대차그룹이 공식 웹사이트에 AI 기반 정보 경험 기능을 도입했습니다. 긴 기사를 요약하고, 원하는 정보를 찾아주며, 음성으로 읽어주는 세 가지 핵심 기능으로 정보 소비 방식이 달라집니다.#현대차그룹 #AI #뉴스룸 #정보경험 #디지털혁신 #블로그 #ODOB