Impressão digital baseada em Canvas: o que é e como funciona?

Desmascarando Impressão Digital Baseada em Canvas: Um Guia Detalhado sobre sua Funcionalidade e Impacto

Essas pegadas foram apagadas, o IP foi substituído. Até limpei o mouse com um lenço umedecido, mas mesmo assim minhas ações foram rastreadas. Mas como isso é possível? Afinal, todas as pegadas digitais foram apagadas. E o Canvas?

A privacidade na internet não é tão simples hoje em dia... Na verdade, ela simplesmente não existe. Mesmo que o usuário tente apagar seus rastros, redes de publicidade, plataformas analíticas e sistemas antifraude ainda rastreiam e identificam seus interesses, gostos e preferências. E depois descobrem seu gênero, idade... E aí não falta muito para descobrirem seu nome completo e endereço residencial. Portanto, é importante proteger seus dados adequadamente, substituindo-os por dados de outras pessoas. Isso inclui o Canvas, que muitos usuários de antidetecção esquecem... Porque não sabem o que é esse "canvas".

Vamos analisar todos os componentes da impressão digital

Esconder-se usando navegadores anônimos é conveniente e eficaz. Com eles, às vezes você pode se disfarçar tanto que nem se reconhece. E houve casos assim na prática. Mas para alcançar resultados tão altos, é necessário preparar adequadamente as impressões digitais. São essas impressões digitais que os antidetects usam para ocultar as verdadeiras características do usuário.

A impressão digital é um conjunto de características reunidas em um único termo. Os sinais que fazem parte dela permitem que os antidetects evitem todos os bloqueios de sites. E também realizem qualquer atividade de várias contas nesses sites.

Os parâmetros que compõem o conjunto de parâmetros da impressão digital podem ser divididos em várias categorias:

  • Principais - incluem: sistema operacional, navegador, sua versão, resolução da tela, frequência do processador, quantidade de memória RAM. E também os valores que fazem parte do User-Agent.

A string User-Agent é uma parte do cabeçalho HTTP enviada pelo aplicativo (neste caso, o navegador) para o servidor. Essa string contém os valores das características do dispositivo do usuário e suas configurações locais. Alguns parâmetros especificados no User-Agent coincidem com os parâmetros transmitidos por outras partes da impressão digital. Portanto, é importante garantir a compatibilidade entre eles. Para isso, o Undetectable adicionou uma ferramenta de verificação de identidade desses valores aos ajustes da impressão digital.

  • Rede - fuso horário, geolocalização, WebRTC.

O protocolo WebRTC é usado para transmitir pacotes de informações pela Internet usando a tecnologia peer-to-peer. É mais frequentemente usado para transferir dados multimídia (voz e som) entre aplicativos da web. Todos os serviços de streaming são baseados nele. Além disso, esse protocolo permite que rastreadores e sistemas antifraude identifiquem o IP do cliente, contornando o servidor proxy.

  • Sistema - tamanho da janela do aplicativo, conjunto de fontes, WebGL e Canvas.

A biblioteca WebGL é usada para adicionar a capacidade de criar gráficos 3D em JavaScript em qualquer navegador. A biblioteca também permite que os sistemas de segurança obtenham informações sobre a placa de vídeo do dispositivo do usuário.

E assim, passo a passo, chegamos ao nosso objetivo de hoje - o parâmetro do sistema da impressão digital, o Canvas. Agora ele receberá toda a nossa atenção, e aqui está o motivo...

O que é o Canvas?

A essência e o propósito desse elemento são fáceis de entender pelo nome. O Canvas permite que o navegador desenhe conteúdo gráfico na página da web por conta própria. Na maioria das vezes, ele é usado em conjunto com um script JavaScript incorporado na página. Mas não é possível descrever e explicar o significado do Canvas em apenas duas frases. Porque ele é multifacetado.

Em primeiro lugar, o Canvas é uma tag de linguagem de hipertexto que foi adicionada ao HTML5. Com essa tag, é possível não apenas desenhar primitivas gráficas bidimensionais na página da web, mas também incorporar conteúdo multimídia no canvas. Incluindo vídeo e áudio.

Atualmente, o Canvas é um padrão amplamente aceito no desenvolvimento web. É suportado por todas as versões de navegadores móveis e desktop. Incluindo o Internet Explorer, que praticamente não é mais usado e não é mais suportado pela Microsoft.

E isso não é uma digressão lírica sobre o destino difícil do IE, mas um fato incontestável que nos permite entender o quão importante o Canvas é para atividades de várias contas de alta qualidade usando antidetects.

Mas o que isso tem a ver com anonimato, impressões digitais e navegadores antidetect? Afinal, não é possível rastrear as ações do usuário e identificá-lo com base na tag HTML. Porque o Canvas é uma tecnologia amplamente reconhecida e essas tags estão presentes (usadas) na marcação de milhões de sites...

Todas essas perguntas surgem porque não conhecemos o outro lado do Canvas. Mas as plataformas de publicidade e análise, que se intrometem em todos os aspectos da vida online dos usuários, conhecem muito bem.

Outros talentos do Canvas

Cada pessoa tem sua própria caligrafia, que é única para ela. Portanto, por meio de uma análise grafológica, é possível determinar o autor de um determinado texto. Mas acontece que não apenas as pessoas têm caligrafia, mas também os computadores.

A principal condição para identificar um usuário por meio do Canvas é fazer com que o dispositivo desenhe algum tipo de primitiva. Em seguida, a amostra da "caligrafia" precisa ser enviada para um grafólogo, que, no caso das impressões digitais, são os sistemas antifraude e as plataformas de análise.

O mecanismo de rastreamento por meio do Canvas é baseado nas peculiaridades do processamento do mesmo elemento gráfico desenhado por cada computador, smartphone ou outro tipo de dispositivo do usuário.

O mecanismo de identificação com base no Canvas funciona da seguinte maneira:

  • Quando o usuário visita um site integrado a um rastreador, o navegador recebe a instrução de desenhar algum primitiva gráfica.
  • Em seguida, com base nos dados de análise do desenho, é gerado um token exclusivo que permite identificar o "indivíduo" do dispositivo com uma precisão de até 90%.
  • O valor do token gerado não é armazenado em cookies, mas é registrado em um banco de dados global.
  • Em seguida, em cada visita subsequente a um recurso de rastreamento, ocorre um desenho gráfico semelhante e o identificador obtido é comparado com os valores no banco de dados.

Ao determinar a identidade digital do usuário por meio do Canvas, as seguintes características técnicas do dispositivo são levadas em consideração:

  • Processador central.
  • Placa de vídeo.
  • Sistema operacional.
  • Peculiaridades do mecanismo de processamento.
  • Nível de compressão de imagens.
  • Parâmetros de exportação.

Também é possível enviar uma string de texto ao invés de uma primitiva gráfica como amostra para identificação. Nesse caso, às configurações mencionadas acima são adicionadas configurações de suavização e renderização de subpixels.

No entanto, é importante entender que o uso do Canvas como uma fonte única de informações para determinar o dispositivo é pouco eficaz. Porque as informações agregadas para gerar o token são transmitidas apenas pela string User-Agent, que fornece uma baixa precisão de identificação.

Além disso, todo o mecanismo de funcionamento das impressões digitais baseadas no Canvas depende inteiramente do suporte do navegador ao JavaScript. É nele que os scripts necessários para carregar e desenhar primitivas gráficas sob demanda são escritos. Se o navegador não suportar JS ou a execução de scripts estiver desativada, o sistema de rastreamento não poderá obter os dados necessários para gerar o valor do token.

Além disso, nenhum sistema de rastreamento e segurança de site confia apenas nas informações obtidas por meio do Canvas. Acima, mencionamos a eficácia desse método de identificação em cerca de 90%. Mas esse alto índice é alcançado apenas em condições de laboratório. E na prática?

Até que ponto podemos confiar no Canvas?

Na realidade, se todos os sistemas antifraude usassem apenas a identificação com base no "canvas", a necessidade de usar antidetects de alta qualidade, como o Undetectable, desapareceria de uma vez por todas.

Para obter um token inválido gerado com base no Canvas, basta ao usuário trocar de navegador ou até mesmo atualizá-lo para uma nova versão. Portanto, esse mecanismo é apenas uma parte secundária da tecnologia de obtenção de impressões digitais.

Os testes de campo desse método de identificação digital também demonstram sua baixa eficácia. Para verificar a precisão das impressões digitais com base no Canvas, os autores do experimento usaram mais de cem computadores. A maioria deles estava executando o Windows 10. Isso permitiu criar condições ainda mais rigorosas para o teste. No entanto, os computadores, tablets e laptops diferiam significativamente uns dos outros em termos de hardware. Principalmente em termos de modelos e características das placas de vídeo, bem como do conjunto de drivers instalados.

Aqui estão alguns resultados do experimento:

  • Os tokens de muitas placas discretas coincidiram com os tokens do Canvas de computadores com placas de vídeo integradas.
  • Quinze laptops testados consecutivamente tinham impressões digitais idênticas.
  • Os traços digitais também coincidiam entre computadores de fabricantes diferentes.

Por exemplo, um laptop Dell do modelo de 2018 tem a mesma impressão digital com base no Canvas que um laptop HP de 2012.

  • Todos os modelos de MacBook Pro lançados ao longo de seis anos (de 2012 a 2018) também têm tokens idênticos.
  • Tablets e laptops com Windows têm impressões digitais semelhantes.

Como você pode ver, é difícil alcançar a singularidade das impressões digitais com base no Canvas. Portanto, é muito fácil passar pela verificação com base nesse tipo de impressão digital. Porque a probabilidade de que o valor do token coincida com o token de outro usuário é bastante alta. Isso ocorre também devido ao aumento constante do número de dispositivos móveis e desktops conectados à internet.

Também é possível questionar a validade dos bancos de dados nos quais os tokens com base no Canvas são armazenados. Provavelmente, cerca de 10-15% dos valores se repetem. Portanto, o uso desses bancos de dados para identificar usuários sem outros parâmetros de impressões digitais é pouco eficaz.

Então, devemos nos preocupar?

Com base nos fatos mencionados acima, fica claro que o Canvas é um sinal fraco para os sistemas antifraude devido à baixa precisão de identificação que ele fornece.

No entanto, em algumas situações, o valor desse parâmetro pode ser decisivo. Portanto, ele está presente nas configurações de impressões digitais do Undetectable. O usuário do antidetect pode desativá-lo ou selecionar o modo "Ruído", no qual o valor do Canvas é gerado aleatoriamente.