Боты ChatGPT с некорректными настройками
Вот ещё весьма показательный момент, про всё это современное ИИ/LLM. Бот от корпорации OpenAI выполняет на dxdt.ru больше тысячи запросов (GET, по адресам записок) в сутки с разных IP, в User-Agent написано: “Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.2; +https://openai.com/gptbot)”. Очевидно, цель – загрузка всё большего количества текстов в синонимайзер-переросток, который потом продвигают в СМИ как уникальный “интеллект”. Вычислительных ресурсов там много, несмотря на “проблемы изменения климата”, поэтому об оптимизации не задумываются – сканируют всё повторно, по много раз.
Приходит этот бот с IP-адресов Microsoft. Однако, игнорируя не только слово “Open” в названии, но и даже минимальные представления об адекватной разработке ботов-сканеров, информационный URL, указанный в User-Agent, недоступен для российских IP-адресов: возвращает HTTP 403 и страничку с надписью “Sorry, you have been blocked”. (С IP-адресов, которые Cloudflare пока что считает не российскими, доступ есть, так что можно убедиться, что это действительно OpenAI.)
P.S. Обратите, кстати, внимание, что тут уже GPTBot/1.2, а не GPTBot/1.1, как у них на сайте указано в описании.
Адрес записки: https://dxdt.ru/2025/02/05/14994/
Похожие записки:
- Совпадения тегов ключей DNSSEC и парадокс дней рождения
- Статья о Certificate Transparency
- Заметки за август 2024
- Реплика: пример про ДСЧ
- Статья о DNSSEC
- Интернет-протокол "дымовой завесы"
- LLM и задача про название книги (на примере GigaChat)
- Техническое: ECDSA на кривой Curve25519 в GNS
- Reuters о сети разведывательных спутников SpaceX
- Временная недоступность dxdt.ru
- Обновление "Избранного"
Написать комментарий