Reddit7 мая 2026 г.

Все зациклены на скорости генерации токенов, но разве префилл не настоящий узкое место?

Автор поста утверждает, что на практике этап префилла (обработка промпта) часто становится главным узким местом, а не скорость генерации токенов. Это особенно актуально для агентных задач с большим контекстом, где ожидание обработки ввода занимает больше времени, чем вывод ответа. Вопрос поднимает дискуссию о приоритетах в оптимизации LLM и актуальности хайпа вокруг MTP.

score 44r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t5o4kc/most_people_seem_obsessed_with_token_generation/