Набеги ботов под прикрытием AI
В логах веб-сервера dxdt.ru тысячи записей о GET-запросах от некоторого ClaudeBot, как указано в User-Agent. Больше в User-Agent ничего не указано, хотя правила хорошего тона предполагают, как минимум, ссылку на страницу с описанием того, “что это, зачем и как оно приходит” – в HTTP это нетрудно сделать. Конечно, в User-Agent каждый может написать что вздумает, но данный ClaudeBot ещё и приходит за одними и теми же страницами (которые не изменялись), постоянно переключая IP-адреса. А IP-адреса там из пула AWS (амазоновский сервис), поэтому даже и обратная зона мало о чем говорит (ну, кроме того, что это AWS). Непонятно, имеют ли следы в логах, оставленные данным ботом, какое-то отношение к деятельности одноимённого продукта очередной AI/ИИ-компании, решения которой для российских пользователей заблокированы, но забавно уже то, что имя используется совпадающее; тем более, что на сайте компании не удалось найти ничего о том, как их боты оформляют свои запросы.
Адрес записки: https://dxdt.ru/2024/01/27/12229/
Похожие записки:
- Записки за октябрь 2023
- Нормализация символов Unicode и доменные имена
- Записки за апрель 2024
- Шумерские цифры и хитрости Unicode
- Умение писать код и DevOps c SRE
- Бывшая "Яндекс.Почта"
- Постквантовая "гибридизация" криптосистем и перспективы стойкости
- Реплика: технологии разного уровня
- Хеш-функции для анонимизации
- LLM и "Яндекс.Поиск"
- Смартфон-шпион: восемь лет спустя
Написать комментарий