Mastodon discussion Apr 15

Anthropic (@AnthropicAI)Anthropic가 자동화된 alignment 연구자(automated alignment researchers)에 대한 연구 결과와 그 파급효과를 소개하는 블로그와 전체 연...

Anthropic (@AnthropicAI)Anthropic가 자동화된 alignment 연구자(automated alignment researchers)에 대한 연구 결과와 그 파급효과를 소개하는 블로그와 전체 연구를 공개했다. AI 정렬 연구를 자동화하는 접근의 의미를 다룬 것으로 보이며, 향후 AI 안전·정렬 연구 ...

Mastodon discussion Apr 15

Anthropic (@AnthropicAI)Anthropic Fellows의 새로운 연구로, 약한 AI 모델이 강한 모델의 학습을 감독하는 ‘Automated Alignment Researcher’ 실험이 소개됐다....

Anthropic (@AnthropicAI)Anthropic Fellows의 새로운 연구로, 약한 AI 모델이 강한 모델의 학습을 감독하는 ‘Automated Alignment Researcher’ 실험이 소개됐다. Claude Opus 4.6이 정렬 연구의 실험 속도와 탐색 범위를 높일 수 있음을 보여주는 의미 있는 연...

GitHub Trending repo Apr 14

baojudezeze/Qwen-dpo: Training code for Diffusion-DPO applied to the Qwen Image-2512 model. This implementation builds on the training framework provided by zk1009 and follows the methodology described in the paper “Diffusion Model Alignment Using Direct Preference Optimization”.

Training code for Diffusion-DPO applied to the Qwen Image-2512 model. This implementation builds on the training framework provided by zk1009 and follows the methodology described ...