Linux / Линукс@linux

Linux / Линукс

ИИ-боты атакуют Open Source: инфраструктура KDE, GNOME и Fedora под угрозой

Открытые проекты, включая KDE, GNOME, Fedora, Codeberg и SourceHut, столкнулись с беспрецедентной нагрузкой на свою инфраструктуру. Причина — агрессивные ИИ-индексаторы, которые сканируют сайты для обучения языковых моделей, таких как Claude 3.7 от Anthropic. Эти боты игнорируют правила доступа к контенту robots.txt, маскируются под обычных пользователей и создают DDoS-подобную нагрузку, угрожая стабильности критически важных сервисов.

▪️ Боты сканируют Git-репозитории, форумы и Wiki, выполняя ресурсоёмкие операции: массовые запросы git blame, перебор всех страниц в git log, скачивание тысяч файлов одновременно.

▪️ Например, на платформе SourceHut боты перегружают серверы, запрашивая историю каждого репозитория построчно, что в 10 раз увеличило нагрузку на базы данных.

Как борются проекты?
• Framapiaf собрала 460 тыс. IP, ai.robots.txt публикует User-Agent ботов.
• Nepenthes (SourceHut): генерирует случайный контент с бесконечными ссылками.
• AI Labyrinth (Cloudflare): подменяет реальные страницы мусором, чтобы «зациклить» ботов.
• Жёсткие меры: блокировка трафика из Google Cloud и Azure.

Предложенные решения:

▪️ Сообщество требует, чтобы компании вроде Anthropic и OpenAI публично отчитались о методах сбора данных.

▪️ Предлагается создать «чёрный список» ИИ-ботов, которые систематически нарушают правила.

▪️ Разработка стандарта AI-robots.txt, который будет юридически обязывающим.

▪️ Внедрение блокчейн-систем для отслеживания источников трафика и автоматической блокировки нарушителей.

▪️ Проекты объединяются в альянсы для обмена данными о ботах. Например, KDE и GNOME уже синхронизируют свои базы IP-адресов.

Linux / Линукс

🥸

Please open Telegram to view this post

VIEW IN TELEGRAM

👍36😁2🤯2

www.tgoop.com/linux_gram/8294

3.63K viewsMar 22 at 04:07

tgoop.com/linux_gram/8294

Create: 2025-03-22
Last Update: 2025-07-30 05:09:00

▪️ Сообщество требует, чтобы компании вроде Anthropic и OpenAI публично отчитались о методах сбора данных.

▪️ Предлагается создать «чёрный список» ИИ-ботов, которые систематически нарушают правила.

▪️ Разработка стандарта AI-robots.txt, который будет юридически обязывающим.

▪️ Внедрение блокчейн-систем для отслеживания источников трафика и автоматической блокировки нарушителей.

▪️ Проекты объединяются в альянсы для обмена данными о ботах. Например, KDE и GNOME уже синхронизируют свои базы IP-адресов.

Linux / Линукс

🥸

Telegram News

ИИ-боты атакуют Open Source: инфраструктура KDE