Новость
Активационный стиринг: туториал по управлению LLM
Статья посвящена технике Activation Steering для контроля вывода больших языковых моделей. Автор демонстрирует практическое применение PyTorch hooks и библиотек nnsight и pyvene для смещения поведения нейросети, например, для снижения токсичности.