Новость
Anthropic представила метод перевода скрытых состояний LLM в естественный язык
Компания Anthropic опубликовала метод Natural Language Autoencoders, который преобразует внутренние активации языковых моделей в связный человеческий текст. Это позволяет исследователям и разработчикам интерпретировать скрытые состояния больших языковых моделей, что является важным шагом в развитии объяснимого ИИ.