Назад к дайджесту
Новость

Тернарный KAN: почему дискретные веса — это фича, а не баг, и работают они лучше

Статья посвящена исследованию архитектуры Kolmogorov-Arnold Networks (KAN) и эксперименту по использованию дискретных весов {-1, 0, +1}. Автор сравнивает KAN с традиционными MLP и показывает, что экстремальное квантование до 1.58 бита может сохранять точность. Публикация описывает технические детали и личные наблюдения по оптимизации нейросетей.