Mastodon discussion May 9

roon (@tszzl)OpenAI와 Anthropic의 정렬(alignment) 논의에서, 많은 사람들이 AI 정렬 연구가 좋은 방향으로 가고 있으며 다음 세대 모델이 인간보다 훨씬 뛰어난 정렬 연구자가 될 것이라...

roon (@tszzl)OpenAI와 Anthropic의 정렬(alignment) 논의에서, 많은 사람들이 AI 정렬 연구가 좋은 방향으로 가고 있으며 다음 세대 모델이 인간보다 훨씬 뛰어난 정렬 연구자가 될 것이라고 본다는 의견이 공유됐다. 향후 모델 역량과 연구 자동화 가능성을 시사하는 내용이다.https://x.co...

Mastodon discussion May 6

Anthropic (@AnthropicAI)Anthropic Fellows의 새 연구 ‘Model Spec Midtraining(MSM)’을 소개한다. 기존 정렬(alignment) 방식은 원하는 행동 예시로만 학습...

Anthropic (@AnthropicAI)Anthropic Fellows의 새 연구 ‘Model Spec Midtraining(MSM)’을 소개한다. 기존 정렬(alignment) 방식은 원하는 행동 예시로만 학습해 새 상황에 일반화가 잘 안 될 수 있는데, MSM은 먼저 AI가 어떤 방식으로 일반화해야 하는지와 그 이...