Назад к дайджесту
Reddit

Теперь можно «прочитать мысли» модели Gemma 3

Исследователи представили метод Natural Language Autoencoders (NLA), позволяющий переводить внутренние активации LLM в понятный текст. Веса для модели Gemma 3 27b уже доступны на Neuronpedia и Hugging Face, что даёт возможность анализировать процесс генерации каждого токена. Инструмент позволяет увидеть, как модель интерпретирует контекст и оценивает правдивость утверждений в реальном времени.

score 59r/LocalLLaMA