GitHub
Бенчмарки THOR: оценка качества LLM для триажа находок
Репозиторий содержит результаты тестирования больших языковых моделей (LLM) на задаче триажа находок в рамках инструмента THOR для цифровой криминалистики. Данные позволяют оценить эффективность ИИ-моделей в анализе и приоритизации угроз безопасности.
240 forksPythonscore 63.8
llmcybersecurityaibenchmarking