O que é De-Anonymization?
De-anonymization é uma técnica usada na mineração de dados que tenta reidentificar informações criptografadas ou obscuras. De-anonymization, também referido a como reidentificação de dados, cruzando informações anônimas com outros dados disponíveis a fim de identificar uma pessoa, grupo ou transação.
Em resumo:
- De-anonymization é a prática de re-constituir as informações privadas armazenadas em dados criptografados ou de outra forma obscurecidos.
- Os dados anonimizados são usados onipresentemente em transações on-line e financeiras, bem como em mídias sociais e outras formas de mensagens eletrônicas e comunicação.
- A reidentificação de dados anonimizados pode comprometer a identidade pessoal e a segurança financeira para fins ilegais, bem como minar a confiança do consumidor.
<
Understanding De-Anonymization
A era do conhecimento tecnológico está rapidamente perturbando a maneira tradicional de fazer as coisas em vários setores da economia. Nos últimos anos, a indústria financeira tem visto muitos produtos digitais serem introduzidos em seu setor por empresas fintech. Esses produtos inovadores promoveram a inclusão financeira através da qual mais consumidores têm acesso a produtos e serviços financeiros a um custo mais baixo do que as instituições financeiras tradicionais permitem. O aumento na implementação da tecnologia trouxe um aumento na coleta, armazenamento e uso de dados.
Ferramentas tecnológicas como plataformas de mídia social, plataformas de pagamento digital e tecnologia de telefone inteligente revelaram uma tonelada de dados usados por várias empresas para melhorar sua interação com os consumidores. Essa tonelada de dados é chamada de dados grandes, e é motivo de preocupação entre os indivíduos e as autoridades reguladoras que exigem mais leis que protejam as identidades e a privacidade dos usuários.
How De-Anonymization Works
In the age of big data where sensitive information about a user’s online activities are shared instantaneously through cloud computing, data anonymization tools have been employed to protect users’ identities. A anonimização mascara as informações pessoalmente identificáveis (PII) dos usuários que transitam em vários campos como serviços de saúde, plataformas de mídia social, comércio eletrônico, etc. A PII inclui informações como data de nascimento, número de seguridade social (SSN), código postal e endereço IP. A necessidade de mascarar as trilhas digitais deixadas pelas atividades on-line levou à implementação de estratégias de anonimização como criptografia, exclusão, generalização e transtorno. Embora os cientistas de dados usem essas estratégias para separar informações sensíveis dos dados compartilhados, eles ainda preservam as informações originais, abrindo assim portas para a possibilidade de reidentificação.
De-anonymization inverte o processo de anonimização ao combinar conjuntos de dados compartilhados, mas limitados, com conjuntos de dados que são facilmente acessíveis on-line. Os mineiros de dados podem então recuperar algumas informações de cada conjunto de dados disponíveis para montar uma identidade ou transação de uma pessoa’s. Por exemplo, um mineiro de dados pode recuperar um conjunto de dados compartilhado por uma empresa de telecomunicações, um site de mídia social, uma plataforma de comércio eletrônico e um resultado de censo disponível ao público para determinar o nome e as atividades freqüentes de um usuário.
How De-Anonymization Is Used
Re-identification can be successful when new information is released or when the anonymization strategy implemented is’t done properly. Com um vasto suprimento de dados e uma quantidade limitada de tempo disponível por dia, os analistas de dados e mineiros estão implementando atalhos conhecidos como heurística na tomada de decisões. Embora a heurística economize tempo e recursos valiosos ao pentear um conjunto de dados, ela também poderia criar lacunas que poderiam ser aproveitadas se a ferramenta heurística errada fosse implementada. Estas lacunas poderiam ser identificadas pelos mineiros de dados que procuram desanonimizar um conjunto de dados para fins legais ou ilegais.
As informações pessoalmente identificáveis obtidas ilegalmente a partir de técnicas de desanonimização podem ser vendidas em mercados subterrâneos, que também são uma forma de plataformas de anonimização. Informações que caem em mãos erradas podem ser usadas para coerção, extorsão e intimidação levando a preocupações de privacidade e enormes custos para as empresas que caem vítimas.
De-anonimização também pode ser usada legalmente. Por exemplo, o website Silk Road, um mercado subterrâneo de drogas ilegais, foi hospedado por uma rede anonimizada chamada Tor, que usa uma estratégia de cebola para ofuscar os endereços IP de seus usuários. A rede Tor também hospeda um par de outros mercados ilegais que comercializam armas, cartões de crédito roubados e informações corporativas sensíveis. Com o uso de ferramentas complexas de desanonimização, o FBI conseguiu rachar e fechar com sucesso a rede Silk Roa Mesmo que ferramentas inovadoras de anonimização fossem implementadas hoje para mascarar dados, os dados poderiam ser reidentificados em alguns anos à medida que novas tecnologias e novos conjuntos de dados ficassem disponíveis.