Реплика: фильтрация поиска
Кстати, поисковые машины, которые пытаются дотянуться до всего в Вебе, уже научились автоматически фильтровать и изменять собранный контент таким образом, чтобы не раскрывать личные данные тех или иных людей. Например, Google замазывает лица и автомобильные номера на панорамах улиц в Street View. Примерно то же можно сделать и с персональными данными, поиск утечек которых в “Яндексе” сейчас довольно популярное занятие, освещаемое СМИ.
Впрочем, очевидно, эта задача посложнее, чем замазывание лиц на фотографиях. Тем не менее, разработать добротный алгоритм можно. А если учитывать, что утечек не так уж много, то подозрительные страницы, отобранные автоматом, могут отсматривать модераторы-люди.
Адрес записки: https://dxdt.ru/2011/07/26/3895/
Похожие записки:
- Реплика: номера портов и работа Интернета
- LLM и "Яндекс.Поиск"
- Encrypted Client Hello и браузеры Google
- Реплика: программные "демультиплексоры" протоколов уровня приложений
- Отмена "фактчекеров" и сервисы Facebook
- "Инспекция" трафика с сохранением конфиденциальности
- Шумный ИИ
- Постквантовая криптография и рост трафика в TLS
- Неравенство треугольника в Интернете и anycast
- X25519Kyber768 в браузере Chrome 124
- Переключение на ML-KEM в браузере Chrome
Комментарии читателей блога: 2
1 <t> // 28th July 2011, 10:44 // Читатель dign написал:
Не забывайте, что главный девиз у Яндекса: “Яндекс найдет все”.
Если сверху не надавят, так и будет дальше находить все. :)
2 <t> // 28th July 2011, 12:40 // Читатель jno написал:
А кому они будут нужны, если не будут “находить всё”?
Убрать лишнее из поиска – задача владельца данных, не поискового бота.
Тут я “с яндексом” согласен.