Реплика: фильтрация поиска
Кстати, поисковые машины, которые пытаются дотянуться до всего в Вебе, уже научились автоматически фильтровать и изменять собранный контент таким образом, чтобы не раскрывать личные данные тех или иных людей. Например, Google замазывает лица и автомобильные номера на панорамах улиц в Street View. Примерно то же можно сделать и с персональными данными, поиск утечек которых в “Яндексе” сейчас довольно популярное занятие, освещаемое СМИ.
Впрочем, очевидно, эта задача посложнее, чем замазывание лиц на фотографиях. Тем не менее, разработать добротный алгоритм можно. А если учитывать, что утечек не так уж много, то подозрительные страницы, отобранные автоматом, могут отсматривать модераторы-люди.
Адрес записки: https://dxdt.ru/2011/07/26/3895/
Похожие записки:
- Техническое: связь SCT-меток с логами Certificate Transparency
- Встроенное проксирование в Google Chrome (IP Protection)
- Продолжение сегментации: Docker Hub
- Реплика: особенности DNSSEC
- HTTPS-записи в DNS и RFC 9460
- STARTTLS и SMTP
- Исчезновение "фрагментации Интернета" с разных точек зрения
- Доверенные программы для обмена сообщениями
- Метаинформация, мессенджеры и цепочки событий в трафике
- Задержки пакетов, СУБД, TCP и РЛС
- Сервис для просмотра логов Certificate Transparency
Комментарии читателей блога: 2
1. 28th July 2011, 10:44 // Читатель dign написал:
Не забывайте, что главный девиз у Яндекса: “Яндекс найдет все”.
Если сверху не надавят, так и будет дальше находить все. :)
2. 28th July 2011, 12:40 // Читатель jno написал:
А кому они будут нужны, если не будут “находить всё”?
Убрать лишнее из поиска – задача владельца данных, не поискового бота.
Тут я “с яндексом” согласен.