Реплика: фильтрация поиска

Кстати, поисковые машины, которые пытаются дотянуться до всего в Вебе, уже научились автоматически фильтровать и изменять собранный контент таким образом, чтобы не раскрывать личные данные тех или иных людей. Например, Google замазывает лица и автомобильные номера на панорамах улиц в Street View. Примерно то же можно сделать и с персональными данными, поиск утечек которых в “Яндексе” сейчас довольно популярное занятие, освещаемое СМИ.

Впрочем, очевидно, эта задача посложнее, чем замазывание лиц на фотографиях. Тем не менее, разработать добротный алгоритм можно. А если учитывать, что утечек не так уж много, то подозрительные страницы, отобранные автоматом, могут отсматривать модераторы-люди.

Адрес записки: https://dxdt.ru/2011/07/26/3895/

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 2

  • 1 <t> // 28th July 2011, 10:44 // Читатель dign написал:

    Не забывайте, что главный девиз у Яндекса: “Яндекс найдет все”.

    Если сверху не надавят, так и будет дальше находить все. :)

  • 2 <t> // 28th July 2011, 12:40 // Читатель jno написал:

    А кому они будут нужны, если не будут “находить всё”?
    Убрать лишнее из поиска – задача владельца данных, не поискового бота.
    Тут я “с яндексом” согласен.