Назад к дайджесту
GitHub

Бенчмарки THOR: оценка качества LLM для триажа находок

Репозиторий содержит результаты тестирования больших языковых моделей (LLM) на задаче триажа находок в рамках инструмента THOR для цифровой криминалистики. Данные позволяют оценить эффективность ИИ-моделей в анализе и приоритизации угроз безопасности.

240 forksPythonscore 63.8
llmcybersecurityaibenchmarking