Реплика: фильтрация поиска
Кстати, поисковые машины, которые пытаются дотянуться до всего в Вебе, уже научились автоматически фильтровать и изменять собранный контент таким образом, чтобы не раскрывать личные данные тех или иных людей. Например, Google замазывает лица и автомобильные номера на панорамах улиц в Street View. Примерно то же можно сделать и с персональными данными, поиск утечек которых в “Яндексе” сейчас довольно популярное занятие, освещаемое СМИ.
Впрочем, очевидно, эта задача посложнее, чем замазывание лиц на фотографиях. Тем не менее, разработать добротный алгоритм можно. А если учитывать, что утечек не так уж много, то подозрительные страницы, отобранные автоматом, могут отсматривать модераторы-люди.
Адрес записки: https://dxdt.ru/2011/07/26/3895/
Похожие записки:
- Трафик на тестовом сервере TLS 1.3 и ESNI
- Новые корневые сертификаты на audit.statdom.ru
- Сорок лет Интернету
- Один сценарий интернет-измерений и поле SNI HTTPS/TLS
- Возможное обновление алгоритмов DNSSEC в корне DNS
- Браузерная реклама от Firefox
- TLS: выбор сертификата по УЦ в зависимости от браузера
- Системы счисления и системное администрирование
- Говорилки в google-поиске
- Письмо про приостановку разработки ИИ
- Удаление "неактивных" google-аккаунтов
Комментарии читателей блога: 2
1. 28th July 2011, 10:44 // Читатель dign написал:
Не забывайте, что главный девиз у Яндекса: “Яндекс найдет все”.
Если сверху не надавят, так и будет дальше находить все. :)
2. 28th July 2011, 12:40 // Читатель jno написал:
А кому они будут нужны, если не будут “находить всё”?
Убрать лишнее из поиска – задача владельца данных, не поискового бота.
Тут я “с яндексом” согласен.