Реплика: фильтрация поиска
Кстати, поисковые машины, которые пытаются дотянуться до всего в Вебе, уже научились автоматически фильтровать и изменять собранный контент таким образом, чтобы не раскрывать личные данные тех или иных людей. Например, Google замазывает лица и автомобильные номера на панорамах улиц в Street View. Примерно то же можно сделать и с персональными данными, поиск утечек которых в “Яндексе” сейчас довольно популярное занятие, освещаемое СМИ.
Впрочем, очевидно, эта задача посложнее, чем замазывание лиц на фотографиях. Тем не менее, разработать добротный алгоритм можно. А если учитывать, что утечек не так уж много, то подозрительные страницы, отобранные автоматом, могут отсматривать модераторы-люди.
Адрес записки: https://dxdt.ru/2011/07/26/3895/
Похожие записки:
- Правила пакетной фильтрации и "постквантовое" ClientHello
- Реплика: перенос доменных имён и GoDaddy
- Техническое: ECDSA на кривой Curve25519 в GNS
- Токены доступа и популярная автоматизация
- Ссылки: популярное описание ECH
- Геоаналитика через "Яндекс"
- DNSSEC и DoS-атаки
- "Пасхалки" в трафике
- Статья о Certificate Transparency
- Kyber768 и TLS-серверы Google
- "Случайные пакеты" как транспорт
Комментарии читателей блога: 2
1 <t> // 28th July 2011, 10:44 // Читатель dign написал:
Не забывайте, что главный девиз у Яндекса: “Яндекс найдет все”.
Если сверху не надавят, так и будет дальше находить все. :)
2 <t> // 28th July 2011, 12:40 // Читатель jno написал:
А кому они будут нужны, если не будут “находить всё”?
Убрать лишнее из поиска – задача владельца данных, не поискового бота.
Тут я “с яндексом” согласен.