Impressão digital baseada em Canvas: o que é e como funciona?
Essas pegadas foram apagadas, o IP foi substituído. Até limpei o mouse com um lenço umedecido, mas mesmo assim minhas ações foram rastreadas. Mas como isso é possível? Afinal, todas as pegadas digitais foram apagadas. E o Canvas?
A privacidade na internet não é tão simples hoje em dia... Na verdade, ela simplesmente não existe. Mesmo que o usuário tente apagar seus rastros, redes de publicidade, plataformas analíticas e sistemas antifraude ainda rastreiam e identificam seus interesses, gostos e preferências. E depois descobrem seu gênero, idade... E aí não falta muito para descobrirem seu nome completo e endereço residencial. Portanto, é importante proteger seus dados adequadamente, substituindo-os por dados de outras pessoas. Isso inclui o Canvas, que muitos usuários de antidetecção esquecem... Porque não sabem o que é esse "canvas".
Vamos analisar todos os componentes da impressão digital
Esconder-se usando navegadores anônimos é conveniente e eficaz. Com eles, às vezes você pode se disfarçar tanto que nem se reconhece. E houve casos assim na prática. Mas para alcançar resultados tão altos, é necessário preparar adequadamente as impressões digitais. São essas impressões digitais que os antidetects usam para ocultar as verdadeiras características do usuário.
A impressão digital é um conjunto de características reunidas em um único termo. Os sinais que fazem parte dela permitem que os antidetects evitem todos os bloqueios de sites. E também realizem qualquer atividade de várias contas nesses sites.
Os parâmetros que compõem o conjunto de parâmetros da impressão digital podem ser divididos em várias categorias:
- Principais - incluem: sistema operacional, navegador, sua versão, resolução da tela, frequência do processador, quantidade de memória RAM. E também os valores que fazem parte do User-Agent.
A string User-Agent é uma parte do cabeçalho HTTP enviada pelo aplicativo (neste caso, o navegador) para o servidor. Essa string contém os valores das características do dispositivo do usuário e suas configurações locais. Alguns parâmetros especificados no User-Agent coincidem com os parâmetros transmitidos por outras partes da impressão digital. Portanto, é importante garantir a compatibilidade entre eles. Para isso, o Undetectable adicionou uma ferramenta de verificação de identidade desses valores aos ajustes da impressão digital.
- Rede - fuso horário, geolocalização, WebRTC.
O protocolo WebRTC é usado para transmitir pacotes de informações pela Internet usando a tecnologia peer-to-peer. É mais frequentemente usado para transferir dados multimídia (voz e som) entre aplicativos da web. Todos os serviços de streaming são baseados nele. Além disso, esse protocolo permite que rastreadores e sistemas antifraude identifiquem o IP do cliente, contornando o servidor proxy.
- Sistema - tamanho da janela do aplicativo, conjunto de fontes, WebGL e Canvas.
A biblioteca WebGL é usada para adicionar a capacidade de criar gráficos 3D em JavaScript em qualquer navegador. A biblioteca também permite que os sistemas de segurança obtenham informações sobre a placa de vídeo do dispositivo do usuário.
E assim, passo a passo, chegamos ao nosso objetivo de hoje - o parâmetro do sistema da impressão digital, o Canvas. Agora ele receberá toda a nossa atenção, e aqui está o motivo...
O que é o Canvas?
A essência e o propósito desse elemento são fáceis de entender pelo nome. O Canvas permite que o navegador desenhe conteúdo gráfico na página da web por conta própria. Na maioria das vezes, ele é usado em conjunto com um script JavaScript incorporado na página. Mas não é possível descrever e explicar o significado do Canvas em apenas duas frases. Porque ele é multifacetado.
Em primeiro lugar, o Canvas é uma tag de linguagem de hipertexto que foi adicionada ao HTML5. Com essa tag, é possível não apenas desenhar primitivas gráficas bidimensionais na página da web, mas também incorporar conteúdo multimídia no canvas. Incluindo vídeo e áudio.
Atualmente, o Canvas é um padrão amplamente aceito no desenvolvimento web. É suportado por todas as versões de navegadores móveis e desktop. Incluindo o Internet Explorer, que praticamente não é mais usado e não é mais suportado pela Microsoft.
E isso não é uma digressão lírica sobre o destino difícil do IE, mas um fato incontestável que nos permite entender o quão importante o Canvas é para atividades de várias contas de alta qualidade usando antidetects.
Mas o que isso tem a ver com anonimato, impressões digitais e navegadores antidetect? Afinal, não é possível rastrear as ações do usuário e identificá-lo com base na tag HTML. Porque o Canvas é uma tecnologia amplamente reconhecida e essas tags estão presentes (usadas) na marcação de milhões de sites...
Todas essas perguntas surgem porque não conhecemos o outro lado do Canvas. Mas as plataformas de publicidade e análise, que se intrometem em todos os aspectos da vida online dos usuários, conhecem muito bem.
Outros talentos do Canvas
Cada pessoa tem sua própria caligrafia, que é única para ela. Portanto, por meio de uma análise grafológica, é possível determinar o autor de um determinado texto. Mas acontece que não apenas as pessoas têm caligrafia, mas também os computadores.
A principal condição para identificar um usuário por meio do Canvas é fazer com que o dispositivo desenhe algum tipo de primitiva. Em seguida, a amostra da "caligrafia" precisa ser enviada para um grafólogo, que, no caso das impressões digitais, são os sistemas antifraude e as plataformas de análise.
O mecanismo de rastreamento por meio do Canvas é baseado nas peculiaridades do processamento do mesmo elemento gráfico desenhado por cada computador, smartphone ou outro tipo de dispositivo do usuário.
O mecanismo de identificação com base no Canvas funciona da seguinte maneira:
- Quando o usuário visita um site integrado a um rastreador, o navegador recebe a instrução de desenhar algum primitiva gráfica.
- Em seguida, com base nos dados de análise do desenho, é gerado um token exclusivo que permite identificar o "indivíduo" do dispositivo com uma precisão de até 90%.
- O valor do token gerado não é armazenado em cookies, mas é registrado em um banco de dados global.
- Em seguida, em cada visita subsequente a um recurso de rastreamento, ocorre um desenho gráfico semelhante e o identificador obtido é comparado com os valores no banco de dados.
Ao determinar a identidade digital do usuário por meio do Canvas, as seguintes características técnicas do dispositivo são levadas em consideração:
- Processador central.
- Placa de vídeo.
- Sistema operacional.
- Peculiaridades do mecanismo de processamento.
- Nível de compressão de imagens.
- Parâmetros de exportação.
Também é possível enviar uma string de texto ao invés de uma primitiva gráfica como amostra para identificação. Nesse caso, às configurações mencionadas acima são adicionadas configurações de suavização e renderização de subpixels.
No entanto, é importante entender que o uso do Canvas como uma fonte única de informações para determinar o dispositivo é pouco eficaz. Porque as informações agregadas para gerar o token são transmitidas apenas pela string User-Agent, que fornece uma baixa precisão de identificação.
Além disso, todo o mecanismo de funcionamento das impressões digitais baseadas no Canvas depende inteiramente do suporte do navegador ao JavaScript. É nele que os scripts necessários para carregar e desenhar primitivas gráficas sob demanda são escritos. Se o navegador não suportar JS ou a execução de scripts estiver desativada, o sistema de rastreamento não poderá obter os dados necessários para gerar o valor do token.
Além disso, nenhum sistema de rastreamento e segurança de site confia apenas nas informações obtidas por meio do Canvas. Acima, mencionamos a eficácia desse método de identificação em cerca de 90%. Mas esse alto índice é alcançado apenas em condições de laboratório. E na prática?
Até que ponto podemos confiar no Canvas?
Na realidade, se todos os sistemas antifraude usassem apenas a identificação com base no "canvas", a necessidade de usar antidetects de alta qualidade, como o Undetectable, desapareceria de uma vez por todas.
Para obter um token inválido gerado com base no Canvas, basta ao usuário trocar de navegador ou até mesmo atualizá-lo para uma nova versão. Portanto, esse mecanismo é apenas uma parte secundária da tecnologia de obtenção de impressões digitais.
Os testes de campo desse método de identificação digital também demonstram sua baixa eficácia. Para verificar a precisão das impressões digitais com base no Canvas, os autores do experimento usaram mais de cem computadores. A maioria deles estava executando o Windows 10. Isso permitiu criar condições ainda mais rigorosas para o teste. No entanto, os computadores, tablets e laptops diferiam significativamente uns dos outros em termos de hardware. Principalmente em termos de modelos e características das placas de vídeo, bem como do conjunto de drivers instalados.
Aqui estão alguns resultados do experimento:
- Os tokens de muitas placas discretas coincidiram com os tokens do Canvas de computadores com placas de vídeo integradas.
- Quinze laptops testados consecutivamente tinham impressões digitais idênticas.
- Os traços digitais também coincidiam entre computadores de fabricantes diferentes.
Por exemplo, um laptop Dell do modelo de 2018 tem a mesma impressão digital com base no Canvas que um laptop HP de 2012.
- Todos os modelos de MacBook Pro lançados ao longo de seis anos (de 2012 a 2018) também têm tokens idênticos.
- Tablets e laptops com Windows têm impressões digitais semelhantes.
Como você pode ver, é difícil alcançar a singularidade das impressões digitais com base no Canvas. Portanto, é muito fácil passar pela verificação com base nesse tipo de impressão digital. Porque a probabilidade de que o valor do token coincida com o token de outro usuário é bastante alta. Isso ocorre também devido ao aumento constante do número de dispositivos móveis e desktops conectados à internet.
Também é possível questionar a validade dos bancos de dados nos quais os tokens com base no Canvas são armazenados. Provavelmente, cerca de 10-15% dos valores se repetem. Portanto, o uso desses bancos de dados para identificar usuários sem outros parâmetros de impressões digitais é pouco eficaz.
Então, devemos nos preocupar?
Com base nos fatos mencionados acima, fica claro que o Canvas é um sinal fraco para os sistemas antifraude devido à baixa precisão de identificação que ele fornece.
No entanto, em algumas situações, o valor desse parâmetro pode ser decisivo. Portanto, ele está presente nas configurações de impressões digitais do Undetectable. O usuário do antidetect pode desativá-lo ou selecionar o modo "Ruído", no qual o valor do Canvas é gerado aleatoriamente.