Новое исследование показывает, что анонимности личных данных «недостаточно для защиты конфиденциальности»

Скандалы, касающиеся нарушений Общего регламента защиты данных (GDPR) заставили ЕС и Великобританию задуматься о необходимости пересмотра указанных руководящих принципов. В продолжение темы – исследование, в котором ученые показывают, как просто даже анонимные наборы данных могут быть прослежены до конкретных людей.

Исследователи говорят, их статья, опубликованная сегодня в Nature Communications , демонстрирует, что для сохранения конфиденциальности людей, требуется гораздо больше, чем просто добавление шума, выборка наборов данных и другие методы идентификации.

Они также создали демонстрационный инструмент, который позволяет людям понять, насколько велика вероятность, что они будут отслежены, даже если набор данных является анонимным, и только небольшая часть его попадает «в умелые руки».

Эти выводы должны стать тревожным сигналом для политиков, побудить их задуматься о необходимости ужесточения правил, касающихся подлинно анонимных данных.

Компании и правительства регулярно собирают и используют наши персональные данные. В Европе данные и способы их использования защищены соответствующими законами, такими как GDPR или законом США о защите прав потребителей Калифорнии (CCPA).

Данные «отбираются» и анонимизируются, что включает в себя извлечение данных для идентификации характеристик, таких как имена и адреса электронной почты, чтобы теоретически невозможно было идентифицировать отдельных лиц. После этого процесса на данные больше не распространяются правила защиты данных, поэтому они могут свободно использоваться и продаваться третьим сторонам, таким как рекламные компании и брокеры данных.

Новое исследование показывает, что однажды купленные данные часто могут быть подвергнуты успешному обратному анализу с использованием специальных программ, для повторной идентификации людей, несмотря на методы анонимизации. Это может раскрыть конфиденциальную информацию о людях, идентифицированных лично.

Исследование впервые демонстрирует, как легко и точно это можно сделать — даже с неполными наборами данных.

В ходе исследования 99,98 процента американцев были правильно повторно идентифицированы при любом доступном «анонимизированном» наборе данных, используя только 15 характеристик, включая возраст, пол и семейное положение.

Первый автор исследования доктор Люк Роше из UCLouvain сказал: «Хотя в Нью-Йорке может быть много людей тридцатилетнего возраста, живущих в Нью-Йорке, гораздо меньше из них родились 5 января и ездят на красной спортивной машине. и жить с двумя детьми (обеими девочками) и одной собакой. »

Исследователи разработали модель ИИ, способную, продемонстрировать вероятность того, что характеристики индивидуума будут достаточно точными, чтобы описать только одного человека из миллиардов людей.

Этот онлайн-инструмент не сохраняет данные и предназначен только для демонстрационных целей, чтобы помочь людям увидеть, какие характеристики делают их уникальными в наборах данных.

Сначала инструмент попросит вас ввести первую часть их почтового кода, пол и дату рождения. Затем он запрашивает ваше семейное положение, количество транспортных средств, статус владения домом и статус занятости. Этих данных достаточно, чтобы с большой долей вероятности вас идентифицировать. При добавлении дополнительных характеристик вероятность совпадения значительно возрастает.

Старший автор, доктор Ив-Александр де Монтжуа из Департамента вычислительной техники и науки о данных компании Imperial, сказал: «Это довольно стандартная информация, которую компании должны запрашивать. Несмотря на то, что они связаны рекомендациями GDPR, они могут свободно продавать анонимные данные. Наше исследование показывает, насколько легко и точно в этой ситуации можно отследить людей.

Компании и правительства приуменьшают риск повторной идентификации, утверждая, что продаваемые ими наборы данных всегда неполны.

Исследователи говорят, что политики должны делать больше, чтобы защитить людей от атак, которые могут иметь серьезные последствия для карьеры, а также личной и финансовой жизни.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

code