tgoop.com/codemining/178
Create:
Last Update:
Last Update:
Just-in-Time Code Duplicates Extraction
Коллеги из JetBrains Research выкатили AntiCopyPaster плагин к IDEA и конечно же выпустили об этом статью.
С одной стороны, грубая копипаста это бич, с которым зачастую борются через встраивание всяческого инструментария в git hooks и в CI, тем не менее есть задачи определения дубликатов just in time, во имя рефакторинга.
Под капотом плагина сверточная нейронная сеточка (CNN), тренировочная база 18 942 фрагментов кода из 13 проектов Apache. Рекомендации рефакторинга (по объединению дубликатов в один метод) с F-мерой 0.82, что очень даже.
Плагин пока в статусе PoC, но уже можно поиграться и оценить полезность.
Данные, оцениваемые подходы (8 штук) и метрики доступны в отдельном репозитории.
BY Code Mining

Share with your friend now:
tgoop.com/codemining/178
