VUI – open-source Jarvis stack with a 300M TTS ModelVUI는 단일 GPU에서 실행 가능한 오픈소스 음성 비서 스택으로, 3억 파라미터의 TTS 모델인 vui nano를 포함합...

VUI – open-source Jarvis stack with a 300M TTS ModelVUI는 단일 GPU에서 실행 가능한 오픈소스 음성 비서 스택으로, 3억 파라미터의 TTS 모델인 vui nano를 포함합니다. 이 모델은 실시간 대화형 음성 합성을 지원하며, 6GB VRAM만으로도 구동 가능합니다. 음성 클로닝 기능도 제공하며, 최대 5분 길이의 음성 프롬프트를 활용할 수 있습니다. 개발자는 커뮤니티 피드백을 통해 개선을 희망하고 있습니다.https://twitter.com/harrycblum/status/2054938872249741812#tts #voiceagent #opensource #llm #realtimespeech

Read Original

Related