Reddit29 апреля 2026 г.

Почему INT8 квантование дало точность выше, чем FP16!

Разработчик заметил, что INT8 квантование дало лучшую точность инференса, чем FP16, вопреки ожиданиям. Обычно FP16 считается более точным из-за близости к FP32, но в случае с ONNX-экспортом наблюдается обратное. Обсуждаются возможные причины такой аномалии в точности вычислений.

score 14r/MachineLearning

reddit.comhttps://www.reddit.com/r/MachineLearning/comments/1sx35es/int8_quantization_gives_me_better_accuracy_than/