“Последовательности событий” и деанонимизация персональных данных

Анонимизировать накопленные персональные данные не всегда просто. Особые сложности возникают, если данных много и они разнообразные. Занимательную проблему создают последовательности событий, привязанные к той или иной персоне (термин “событие” тут, понятно, условный). Например, именно из-за этой особенности несложно в автоматическом режиме деанонимизировать базу, содержащую записи перемещения абонентов мобильных телефонов по городу. В этом случае срабатывают всего два “события” – “абонент прибыл в офис” и “абонент прибыл домой”. Использование более длинных последовательностей только облегчает решение задачи.

Хитрость в том, что число возможных перестановок и сочетаний тех или иных “общих” событий оказывается велико. Поэтому даже для больших массивов данных, в которые входят сведения о тысячах людей, для каждого можно найти уникальную последовательность (отпечаток). Остаётся сопоставить эту последовательность с дополнительной информацией, требуемой, обычно, в минимальном объёме, и персоналии окажутся раскрыты. Для публичных персон – на роль ключа годятся сообщения прессы. Или “статусы” в интернетовских социальных сетях.

Вот, скажем, записываются данные о посещении магазинов и совершении покупок, без указания идентифицирующих покупателей сведений (фамилия, имя, отчество и т.п.). Если в базе сохраняется время совершения покупки в том или ином магазине и список этих покупок, то вычислить, кому принадлежит данный “потребительский след”, совсем нетрудно, имея на руках хотя бы пару-тройку чеков из “цепочки” и зная данные соответствующих покупателей. Последние можно получить из платёжной системы. Думаю, понятно, что для проведения деанонимизации годится как время совершения покупки, так и просто их список, в том числе, взятый в виде суммы по нескольким “эпизодам”. При этом, из базы сразу же восстанавливается дополнительная информация о действиях данного покупателя в других торговых точках.

Точно такой же подход хорошо работает для медицинских записей, для списков посещённых веб-сайтов, да и вообще – для всякой “социальной” активности, не предусматривающей строгого следования заданной схеме действий. Другими словами, цепочки следов идентифицируют персону ничуть не хуже, чем традиционные, “анкетные” персональные данные.

Адрес записки: https://dxdt.ru/2012/09/20/5241/

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 16

  • 1. 20th September 2012, 17:10 // Читатель зашел в гости написал:

    до “Большого Брата” осталось немного – проделывать все вышеописанное в автоматическом режиме.
    Все элементы системы уже существуют и работают. Надо их обьединить.
    покупки в магазине – оплата карточками. метро – карточка. бензин на заправке – опять карточка. на улицах – видеокамеры с системами распознавания лица. на дорогах – видеокамеры, читающие автомобильные номера и тэги для автоматической оплаты проезда по мостам/тоннелям/автострадам. уже упомянутые сотовые телефоны и всякая электроника с wi-fi. интернет – вообще малина: контент со смысловой нагрузкой, хочешь – психологическое профилирование “клиента”, хочешь – компромат.
    Обьединение всего этого в одну систему, навеное, вопрос времени. А вот полностью “выключить” себя из такой системы? Сложно. Работу нужно искать такую, чтоб налом платили и личность вашу особо не проверяли. Автомобиль – забудьте. Недвижимость – тоже. Солнечные очки, кепка и длинноволосый парик, даже ночью. Мрак.

  • 2. 21st September 2012, 00:53 // Читатель heferandrej написал:

    Все мы “под колпаком у Мюллера”, спецслужбам приспичит – найдут любого, по любой статистике. И вообще то – статистика – великое дело!

  • 3. 21st September 2012, 17:42 // Читатель jno написал:

    Большому брату больше делать нефиг, как помойку деанонимизировать!
    ББ получит данные *все* и *сразу*.

    Описываемая развлекуха – это для кагала коммерческо-криминальных ублюдков, которые могут трекать кого угодно как ни попадя, не нарушая дурацкого 152-ФЗ…

  • 4. 21st September 2012, 17:48 // Читатель jno написал:

    А вот налом з/п грести – не обязательно!
    Просто сразу обналичиваем.
    Суммы к снятию и порядок обхода банкоматов – сгенерим программно :)
    Автомобиль (ну, пардон, какой уж будет) возьмём за “300 баксов” по рукописной доверенности (а ля джихад-такси, но вам шашечки или ехать?).
    Недвижимость оформляем на юрлицо, зареганное в оффшоре.
    А простая бейсболка эффективно херит *все* камеры наблюдения (проверено лично с консультацией в ментовке).

  • 5. 21st September 2012, 17:50 // Читатель jno написал:

    Ах, да!
    Совсем забыл национальные особенности видеонаблюдения!
    *Снилось мне*, что далеко не все камеры наблюдения вообще подключены, едрёнтыть!

  • 6. 21st September 2012, 18:04 // Читатель зашел в гости написал:

    ну, если у вас есть счет в банке, то каждая операция уже отслеживается, тем более, что отслеживать могут вплоть до номеров выдаваемых автоматом банкнот. Нет, это не то.
    можно, конечно, все оформлять на чужое имя: и недвижимость, и транспорт, но это уязвимость – нужно полагаться на третью сторону, и если ББ выйдет на эту личность, то все наши потуги по “обезличиванию” собственной личности – коту под хвост. это тоже не то.
    бесболка – это как раз то, о чем я и говорил. прийдется носить эту дурацкую шапку (ненавижу бейсболки) круглый год, днем и ночью.

  • 7. 21st September 2012, 18:25 // Читатель sarin написал:

    а как же быть с относительностью одновременности? ведь события для отслеживаемого гражданина и наблюдателя в теории могут происходить в разных последовательностях?

  • 8. 21st September 2012, 18:58 // Читатель зашел в гости написал:

    то есть как в разных последовательностях? В смысле, задержки с доставкой данных, типа с уличной видеокамеры файл приходит на день позже? Так на файле время проставлено… Я вопрос не совсем понимаю…

  • 9. 21st September 2012, 19:51 // Читатель jno написал:

    Ещё раз, вслух прописью и по буквам:

    От госорганов (ака “Большого Брата”) можно прятаться ровно до тех пор, пока Вас никто всерьёз не ищет!
    В случае реальной разработки остаётся лишь надеяться на некоторую временнУю фору, чтобы сделать ноги (бросив карточки, тачки, хаты и прочее, нажитое непосильным трудом).
    Разумеется, и ноги делать имеет смысл только при наличии достаточных ресурсов.
    Иначе станете простым уркой в бегах.

  • 10. 21st September 2012, 20:16 // Читатель зашел в гости написал:

    “От госорганов (ака “Большого Брата”) можно прятаться ровно до тех пор, пока Вас никто всерьёз не ищет!”

    ага: http://www.fbi.gov/wanted/topten

    только не говорите мне, пожалуйста, что американцы тупые, что искать не умеют, и т.д. С ихними ресурсами и культурой доносительства (ну, или стукачества, кому что нравится) все эти люди должны быть давным-давно за решеткой.

  • 11. 23rd September 2012, 18:45 // Читатель jno написал:

    Да нет, не тупые.
    Но.
    Эта публика – в бегах.
    И “шифруется” не так, как мы тут обсуждаем – тачки, квартиры, карточки… ага, щаз.
    Спросите любого более-менее “бывалого” – узнаете много интересного про такую жизнь.

    Опять же я не очень уверен, что быть в списке “топ 10 вонтед” то же самое, что быть в плотной оперативной разработке…

  • 12. 24th September 2012, 17:55 // Читатель зашел в гости написал:

    это, конечно, совсем “офф-офф-топик” от де-анонимизации личных данных, но “оперативная разработка” тоже имеет свои границы, и байки о “длинных руках” КГБ/ЦРУ/мафии – именно байки, и не более. “Публика в бегах” не в лесу живет, а где-нибудь в Урюпинске/Спрингфилде, на сьемной квартире в 100 метрах от полицейского участка. Затем, что такое “топ 10”, если не оперативная разработка? Кого-то “Большой Брат” может поймать, да, а с кем-то возникнут трудности. Популярные примеры: Чикатило и Битцевский маньяк. Люди и в бегах-то не были, а “разрабатывали” их чуть ли не по 10 лет. Причем Чикатило ловили еще в СССР, всей страной, следствием руководили чуть ли не из Кремля…

  • 13. 24th September 2012, 18:48 // Читатель jno написал:

    Чикатило, ЕМНИМС, в розыске (именно как Чикатило, а не неизвестный преступник) и не был. А вот всякие березовские – уже в Лондоне…

  • 14. 24th September 2012, 19:13 // Читатель зашел в гости написал:

    “…а не неизвестный преступник”

    люди из “топ тен” – в розыске, имеются и фотографии и все анкетные данные, и тем не менее… После “анонимизации”, т.е. избавления от банковских счетов, сотовых телефонов и т.д. от человека остается фотография, да имя с фамилией. С первым, как вы сами говорили, хорошо справляется обыкновенная бейсболка, а Ф.И.О. себе и новые придумать можно. Если платишь наличными – никто и спрашивать особо не будет. Вот и ищи ветра в поле…

  • 15. 24th September 2012, 20:03 // Читатель jno написал:

    а вот те – реально в бегах :)

  • 16. 25th September 2012, 16:50 // Читатель sarin написал:

    зашел в гости, это была шутка.

    я имел ввиду относительность одновременности из теории относительности в соответствии с которой события, одновременные в одной системе отсчёта могут быть не одновременными в другой.