Назад к дайджесту
Новость

Трудности перевода: почему LLM не пишут нормальные докстринги на русском и как это исправить

Статья разбирает проблемы генерации технической документации кодом на русском языке языковыми моделями: ошибки терминологии и нарушение структуры docstring. Авторы из MWS AI объясняют, что причина кроется в отсутствии качественных датасетов, и представляют новый набор данных StRuCom, специально созданный для обучения ИИ написанию комментариев.