Назад к дайджесту
Reddit

vibevoice.cpp: Порт Microsoft VibeVoice (TTS + ASR с диаризацией) на ggml/C++ без Python при инференсе

Разработчики выпустили C++-порт модели Microsoft VibeVoice на базе ggml, объединяющий синтез речи, распознавание и диаризацию. Инструмент поддерживает инференс на CPU, CUDA, Metal и Vulkan без зависимости от Python. Предоставлены готовые GGUF-модели и бенчмарки для локального использования.

score 97r/LocalLLaMA