Mastodon discussion Discussions 5h ago

In Self-Refine, a single frozen LLM acts as generator, critic, and rewriter in a prompt-only loop, and the paper reports...

by Benjamin Han

In Self-Refine, a single frozen LLM acts as generator, critic, and rewriter in a prompt-only loop, and the paper reports about 20 points of average lift across seven tasks without any training, RL, or external signal. The gains vary widely by task: small on math reasoning, but large on dialogue and constrained generation, where what counts as "good" is hardest to define from a one-line critique.https://benjaminhan.net/posts/20260516-self-refine/?utm_source=mastodon&utm_medium=social#SelfRefine #LLMs #AI #Reasoning #Metacognition

Read Original

LLM

Metadata

Replies Count: 1
Account: BenjaminHan@sigmoid.social

Mastodon discussion 22m ago

Wielu menedżerów wstrzymuje wdrożenia sztucznej inteligencji, wierząc, że ich firmowe bazy danych wymagają wieloletniego...

Wielu menedżerów wstrzymuje wdrożenia sztucznej inteligencji, wierząc, że ich firmowe bazy danych wymagają wieloletniego sprzątania. Joe Rose z JBS Dev przekonuje, że to błąd: wspó...

Mastodon discussion 22m ago

W obliczu rekordowych kolejek i paraliżu oddziałów ratunkowych brytyjski NHS coraz śmielej sięga po sztuczną inteligencj...

W obliczu rekordowych kolejek i paraliżu oddziałów ratunkowych brytyjski NHS coraz śmielej sięga po sztuczną inteligencję. Systemy monitoringu predykcyjnego nie tylko odciążają lek...

Mastodon discussion 23m ago

현대차 웹사이트가 AI로 달라졌다현대차그룹이 공식 웹사이트에 AI 기반 정보 경험 기능을 도입했습니다. 긴 기사를 요약하고, 원하는 정보를 찾아주며, 음성으로 읽어주는 세 가지 핵심 기능으로 정보 소비 방식이 달라집...

현대차 웹사이트가 AI로 달라졌다현대차그룹이 공식 웹사이트에 AI 기반 정보 경험 기능을 도입했습니다. 긴 기사를 요약하고, 원하는 정보를 찾아주며, 음성으로 읽어주는 세 가지 핵심 기능으로 정보 소비 방식이 달라집니다.#현대차그룹 #AI #뉴스룸 #정보경험 #디지털혁신 #블로그 #ODOB

In Self-Refine, a single frozen LLM acts as generator, critic, and rewriter in a prompt-only loop, and the paper reports...

Metadata

Related

Wielu menedżerów wstrzymuje wdrożenia sztucznej inteligencji, wierząc, że ich firmowe bazy danych wymagają wieloletniego...

W obliczu rekordowych kolejek i paraliżu oddziałów ratunkowych brytyjski NHS coraz śmielej sięga po sztuczną inteligencj...

현대차 웹사이트가 AI로 달라졌다현대차그룹이 공식 웹사이트에 AI 기반 정보 경험 기능을 도입했습니다. 긴 기사를 요약하고, 원하는 정보를 찾아주며, 음성으로 읽어주는 세 가지 핵심 기능으로 정보 소비 방식이 달라집...