Turning recorded D&D sessions into comics이 프로젝트는 실제 D&D 세션을 녹음한 후, ElevenLabs의 아이슬란드어 음성인식으로 텍스트를 추출하고 Claude Code를 활용해 만화 스크립트로 변환하는 파이프라인을 구축했다. 각 캐릭터별 참조 이미지로 일관된 비주얼을 유지하며, 페이지별 대본 승인 절차를 통해 오류를 최소화한다. 최종적으로 GPT-image-2 모델로 각 페이지를 생성하며, DM의 내레이션과 효과음도 시각적으로 표현한다. 이 시스템은 세션 요약을 그래픽 노블 형태로 제공해 플레이어들이 쉽게 내용을 복습할 수 있도록 돕는다.https://haffi112.github.io/2026/05/14/dnd-comics/#speechtotext #comicgeneration #ttrpg #llm #multimodal
Related
New AI models can now work with text, images, and sound, unlike older models that only used text. This is a big step for...
New AI models can now work with text, images, and sound, unlike older models that only used text. This is a big step forward.#AI, #LLM, #TechNews, #Innovation, #MultimodalAIhttps:/...
The Movie That Changed Cybersecurity: A Tech Focused Look At WarGames If you work in cybersecurity or artificial intelli...
The Movie That Changed Cybersecurity: A Tech Focused Look At WarGames If you work in cybersecurity or artificial intelligence today, you have likely suffered through your fair shar...
Even at a so-called "elite" institution like Princeton, 30% of students are using #AI to cheat: https://arstechnica.com/...
Even at a so-called "elite" institution like Princeton, 30% of students are using #AI to cheat: https://arstechnica.com/tech-policy/2026/05/ai-driven-cheating-widespread-even-at-el...