GitHub4 июня 2026 г.

Бенчмарки THOR: оценка качества LLM для триажа находок

Репозиторий содержит результаты тестирования больших языковых моделей (LLM) на задаче триажа находок в рамках инструмента THOR для цифровой криминалистики. Данные позволяют оценить эффективность ИИ-моделей в анализе и приоритизации угроз безопасности.

240 forksPythonscore 63.8

llmcybersecurityaibenchmarking

Nextron-Labs/thor-ai-benchmarkshttps://github.com/Nextron-Labs/thor-ai-benchmarks