Anthropic (@AnthropicAI)Anthropic Fellows의 새 연구 ‘Model Spec Midtraining(MSM)’을 소개한다. 기존 정렬(alignment) 방식은 원하는 행동 예시로만 학습...

Anthropic (@AnthropicAI)Anthropic Fellows의 새 연구 ‘Model Spec Midtraining(MSM)’을 소개한다. 기존 정렬(alignment) 방식은 원하는 행동 예시로만 학습해 새 상황에 일반화가 잘 안 될 수 있는데, MSM은 먼저 AI가 어떤 방식으로 일반화해야 하는지와 그 이유를 가르치는 접근이다.https://x.com/AnthropicAI/status/2051758528562364902#anthropic #alignment #llm #research #training

Read Original

Related