“Последовательности событий” и деанонимизация персональных данных
Анонимизировать накопленные персональные данные не всегда просто. Особые сложности возникают, если данных много и они разнообразные. Занимательную проблему создают последовательности событий, привязанные к той или иной персоне (термин “событие” тут, понятно, условный). Например, именно из-за этой особенности несложно в автоматическом режиме деанонимизировать базу, содержащую записи перемещения абонентов мобильных телефонов по городу. В этом случае срабатывают всего два “события” – “абонент прибыл в офис” и “абонент прибыл домой”. Использование более длинных последовательностей только облегчает решение задачи.
Хитрость в том, что число возможных перестановок и сочетаний тех или иных “общих” событий оказывается велико. Поэтому даже для больших массивов данных, в которые входят сведения о тысячах людей, для каждого можно найти уникальную последовательность (отпечаток). Остаётся сопоставить эту последовательность с дополнительной информацией, требуемой, обычно, в минимальном объёме, и персоналии окажутся раскрыты. Для публичных персон – на роль ключа годятся сообщения прессы. Или “статусы” в интернетовских социальных сетях.
Вот, скажем, записываются данные о посещении магазинов и совершении покупок, без указания идентифицирующих покупателей сведений (фамилия, имя, отчество и т.п.). Если в базе сохраняется время совершения покупки в том или ином магазине и список этих покупок, то вычислить, кому принадлежит данный “потребительский след”, совсем нетрудно, имея на руках хотя бы пару-тройку чеков из “цепочки” и зная данные соответствующих покупателей. Последние можно получить из платёжной системы. Думаю, понятно, что для проведения деанонимизации годится как время совершения покупки, так и просто их список, в том числе, взятый в виде суммы по нескольким “эпизодам”. При этом, из базы сразу же восстанавливается дополнительная информация о действиях данного покупателя в других торговых точках.
Точно такой же подход хорошо работает для медицинских записей, для списков посещённых веб-сайтов, да и вообще – для всякой “социальной” активности, не предусматривающей строгого следования заданной схеме действий. Другими словами, цепочки следов идентифицируют персону ничуть не хуже, чем традиционные, “анкетные” персональные данные.
Адрес записки: https://dxdt.ru/2012/09/20/5241/
Похожие записки:
- Криптографическая библиотека для Arduino: дополнение для новых IDE
- Открытые "исходники" и "бинарный" код с точки зрения ИБ
- Ретроспектива заметок: сентябрь 2013 года
- CVE-2024-3661 (TunnelVision) и "уязвимость" всех VPN
- Стандарты NIST для "постквантовых" криптосистем
- Переключение на ML-KEM в браузере Chrome
- Смартфон-шпион: восемь лет спустя
- Техническое описание TLS: обновление 2022
- Про цепочки, RSA и ECDSA
- TLS в виртуальных машинах и извлечение ключей хостингом
- "Умные" колонки и смартфоны
Комментарии читателей блога: 16
1. 20th September 2012, 17:10 // Читатель зашел в гости написал:
до “Большого Брата” осталось немного – проделывать все вышеописанное в автоматическом режиме.
Все элементы системы уже существуют и работают. Надо их обьединить.
покупки в магазине – оплата карточками. метро – карточка. бензин на заправке – опять карточка. на улицах – видеокамеры с системами распознавания лица. на дорогах – видеокамеры, читающие автомобильные номера и тэги для автоматической оплаты проезда по мостам/тоннелям/автострадам. уже упомянутые сотовые телефоны и всякая электроника с wi-fi. интернет – вообще малина: контент со смысловой нагрузкой, хочешь – психологическое профилирование “клиента”, хочешь – компромат.
Обьединение всего этого в одну систему, навеное, вопрос времени. А вот полностью “выключить” себя из такой системы? Сложно. Работу нужно искать такую, чтоб налом платили и личность вашу особо не проверяли. Автомобиль – забудьте. Недвижимость – тоже. Солнечные очки, кепка и длинноволосый парик, даже ночью. Мрак.
2. 21st September 2012, 00:53 // Читатель heferandrej написал:
Все мы “под колпаком у Мюллера”, спецслужбам приспичит – найдут любого, по любой статистике. И вообще то – статистика – великое дело!
3. 21st September 2012, 17:42 // Читатель jno написал:
Большому брату больше делать нефиг, как помойку деанонимизировать!
ББ получит данные *все* и *сразу*.
Описываемая развлекуха – это для кагала коммерческо-криминальных ублюдков, которые могут трекать кого угодно как ни попадя, не нарушая дурацкого 152-ФЗ…
4. 21st September 2012, 17:48 // Читатель jno написал:
А вот налом з/п грести – не обязательно!
Просто сразу обналичиваем.
Суммы к снятию и порядок обхода банкоматов – сгенерим программно :)
Автомобиль (ну, пардон, какой уж будет) возьмём за “300 баксов” по рукописной доверенности (а ля джихад-такси, но вам шашечки или ехать?).
Недвижимость оформляем на юрлицо, зареганное в оффшоре.
А простая бейсболка эффективно херит *все* камеры наблюдения (проверено лично с консультацией в ментовке).
5. 21st September 2012, 17:50 // Читатель jno написал:
Ах, да!
Совсем забыл национальные особенности видеонаблюдения!
*Снилось мне*, что далеко не все камеры наблюдения вообще подключены, едрёнтыть!
6. 21st September 2012, 18:04 // Читатель зашел в гости написал:
ну, если у вас есть счет в банке, то каждая операция уже отслеживается, тем более, что отслеживать могут вплоть до номеров выдаваемых автоматом банкнот. Нет, это не то.
можно, конечно, все оформлять на чужое имя: и недвижимость, и транспорт, но это уязвимость – нужно полагаться на третью сторону, и если ББ выйдет на эту личность, то все наши потуги по “обезличиванию” собственной личности – коту под хвост. это тоже не то.
бесболка – это как раз то, о чем я и говорил. прийдется носить эту дурацкую шапку (ненавижу бейсболки) круглый год, днем и ночью.
7. 21st September 2012, 18:25 // Читатель sarin написал:
а как же быть с относительностью одновременности? ведь события для отслеживаемого гражданина и наблюдателя в теории могут происходить в разных последовательностях?
8. 21st September 2012, 18:58 // Читатель зашел в гости написал:
то есть как в разных последовательностях? В смысле, задержки с доставкой данных, типа с уличной видеокамеры файл приходит на день позже? Так на файле время проставлено… Я вопрос не совсем понимаю…
9. 21st September 2012, 19:51 // Читатель jno написал:
Ещё раз, вслух прописью и по буквам:
От госорганов (ака “Большого Брата”) можно прятаться ровно до тех пор, пока Вас никто всерьёз не ищет!
В случае реальной разработки остаётся лишь надеяться на некоторую временнУю фору, чтобы сделать ноги (бросив карточки, тачки, хаты и прочее, нажитое непосильным трудом).
Разумеется, и ноги делать имеет смысл только при наличии достаточных ресурсов.
Иначе станете простым уркой в бегах.
10. 21st September 2012, 20:16 // Читатель зашел в гости написал:
“От госорганов (ака “Большого Брата”) можно прятаться ровно до тех пор, пока Вас никто всерьёз не ищет!”
ага: http://www.fbi.gov/wanted/topten
только не говорите мне, пожалуйста, что американцы тупые, что искать не умеют, и т.д. С ихними ресурсами и культурой доносительства (ну, или стукачества, кому что нравится) все эти люди должны быть давным-давно за решеткой.
11. 23rd September 2012, 18:45 // Читатель jno написал:
Да нет, не тупые.
Но.
Эта публика – в бегах.
И “шифруется” не так, как мы тут обсуждаем – тачки, квартиры, карточки… ага, щаз.
Спросите любого более-менее “бывалого” – узнаете много интересного про такую жизнь.
Опять же я не очень уверен, что быть в списке “топ 10 вонтед” то же самое, что быть в плотной оперативной разработке…
12. 24th September 2012, 17:55 // Читатель зашел в гости написал:
это, конечно, совсем “офф-офф-топик” от де-анонимизации личных данных, но “оперативная разработка” тоже имеет свои границы, и байки о “длинных руках” КГБ/ЦРУ/мафии – именно байки, и не более. “Публика в бегах” не в лесу живет, а где-нибудь в Урюпинске/Спрингфилде, на сьемной квартире в 100 метрах от полицейского участка. Затем, что такое “топ 10”, если не оперативная разработка? Кого-то “Большой Брат” может поймать, да, а с кем-то возникнут трудности. Популярные примеры: Чикатило и Битцевский маньяк. Люди и в бегах-то не были, а “разрабатывали” их чуть ли не по 10 лет. Причем Чикатило ловили еще в СССР, всей страной, следствием руководили чуть ли не из Кремля…
13. 24th September 2012, 18:48 // Читатель jno написал:
Чикатило, ЕМНИМС, в розыске (именно как Чикатило, а не неизвестный преступник) и не был. А вот всякие березовские – уже в Лондоне…
14. 24th September 2012, 19:13 // Читатель зашел в гости написал:
“…а не неизвестный преступник”
люди из “топ тен” – в розыске, имеются и фотографии и все анкетные данные, и тем не менее… После “анонимизации”, т.е. избавления от банковских счетов, сотовых телефонов и т.д. от человека остается фотография, да имя с фамилией. С первым, как вы сами говорили, хорошо справляется обыкновенная бейсболка, а Ф.И.О. себе и новые придумать можно. Если платишь наличными – никто и спрашивать особо не будет. Вот и ищи ветра в поле…
15. 24th September 2012, 20:03 // Читатель jno написал:
а вот те – реально в бегах :)
16. 25th September 2012, 16:50 // Читатель sarin написал:
зашел в гости, это была шутка.
я имел ввиду относительность одновременности из теории относительности в соответствии с которой события, одновременные в одной системе отсчёта могут быть не одновременными в другой.