Reddit4 мая 2026 г.

torch-nvenc-compress: Использование NVENC для сжатия данных LLM и обхода PCIe-бутылочного горлышка

Разработчик создал библиотеку на Python, использующую аппаратные видеокодеки GPU Nvidia для сжатия активаций и KV-кэша при многокарточном инференсе. Это позволяет преодолеть ограничения пропускной способности PCIe, передавая меньший объём данных между картами. Решение включает PCA-предобработку и прямые обёртки над Video Codec SDK без накладных расходов.

score 12r/MachineLearning

reddit.comhttps://www.reddit.com/r/MachineLearning/comments/1t2zy4h/torchnvenccompress_gpu_nvenc_silicon_as_a_pcie/