Pergunta para o especialista: É verdade que as redes sociais estão nos observando

Dmitry Kurkin

RESPOSTAS À MAIORIA DAS PERGUNTAS DOS EUA nós costumávamos pesquisar on-line. Na nova série de materiais, fazemos essas perguntas: queimando, inesperada ou generalizada - para profissionais em vários campos.

O flash mob de 10 anos, lançado nas redes sociais no início do ano, não apenas gerou teorias de conspiração de que o objetivo da campanha era coletar fotos de usuários e treiná-los para reconhecer o sistema de reconhecimento facial, mas também fazê-los pensar sobre o quanto eles sabem sobre nós. redes sociais e terceiros que trabalham com eles (de empresas comerciais a agências governamentais).

O fato de os gigantes da tecnologia estarem coletando e analisando as chamadas pegadas digitais deixadas por bilhões de usuários diariamente não é segredo para ninguém. E a consciência disso dá origem a um novo tipo de medo do “irmão mais velho”: as redes sociais sabem muito sobre nós, mas e se eles souberem muito sobre nós? O big data pode ser usado para descobrir todas as conexões, gostos, hábitos de uma pessoa, seu passado e seu presente? E, em caso afirmativo, que mal pode nosso desejo de socializar on-line, pelo qual compartilhamos voluntariamente informações sobre nós mesmos, nos causar?

Perguntamos a especialistas sobre como os dados de usuários são processados por grandes empresas e quão grande é o perigo de herdar nas redes sociais.

Liliya Zemnukhova

Pesquisador do Centro de Pesquisas Científicas e Tecnológicas da Universidade Européia de São Petersburgo

Uma pegada digital contém todos os tipos possíveis de dados - textos, imagens, gravações de áudio e vídeo, geolocalização e muitos metadados (por exemplo, modelo de gadget, operador móvel, sistema operacional, dinâmica e duração das visitas, etc.). E não somos apenas nós que reabastecemos nossa pegada digital. As redes sociais nos formam como usuários com a ajuda de três fontes de dados: o fato de que nós mesmos relatamos sobre nós mesmos; que outros relatam sobre nós; e o que é mais frequente sem o nosso conhecimento. Especialmente opaca por último. Nós, como regra, não lemos acordos e políticas de usuários para a coleta e uso de dados pessoais. Apenas notamos que essa “caixa preta” de alguma forma influencia nossa experiência de usuário: publicidade direcionada, sugestões de amigos, recomendações de música, o procedimento para lançar notícias ... Construímos uma pequena parte dessa experiência quando construímos manualmente o feed de notícias, mas principalmente algoritmos executar as funções incorporadas nos perfis padrão. É por isso que nunca nos livraremos de publicidade contextual ou sugestões intrusivas de grupos ou (não) amigos. Redes sociais como corporações usam dados sobre seus usuários para fins comerciais, oferecendo sua plataforma para vender conteúdo direcionado. E, ao longo do caminho, eles continuam a coletar dados sobre nós: por exemplo, se você pagou pela publicidade pelo menos uma vez, os dados do cartão bancário e da transação também permanecem com a empresa. Os dados também podem ser fornecidos a agências governamentais quando há uma grande necessidade: por exemplo, o Facebook colabora regularmente com agências do governo dos EUA, de acordo com sua política de transparência.

Além da política interna de redes sociais, há mais um detalhe importante: contas podem ser associadas a centenas de milhares de outros aplicativos e funções. Esse, por exemplo, foi o motivo de grandes discussões no ano passado sobre o acesso de terceiros aos dados do usuário. Uma importante tentativa de regulamentar a liberdade dos desenvolvedores foi feita na União Européia - o Regulamento Geral de Proteção de Dados (GDPR) entrou em vigor no ano passado. Ele decidiu não transferir problemas de dados, mas chamou a atenção dos usuários para essa questão. Isso não nos obriga a ler todos os acordos de usuários, mas nos faz pensar e, pelo menos, ser mais responsáveis por nossos rastros digitais e seguir as regras elementares da higiene digital.

Valeria Karavaeva

data scientist na Spiking

Às vezes, não pensamos em quantas faixas deixamos na Web e quanto mais tarde isso ajuda as empresas, não apenas as redes sociais - embora também as redes sociais. As redes sociais coletam dados não apenas para si, podem vendê-los - eu sei sobre isso, porque trabalhei em uma agência de publicidade e compramos dados do Facebook. E na maioria das vezes nós, os usuários, damos consentimento a isso sem perceber. As pessoas passam metade de suas vidas nas redes sociais e dão muita informação sobre si mesmas.

Mas foi possível coletar dados antes - então, por que você começou a falar sobre big data recentemente? Primeiro de tudo, porque o poder de computação cresce e, consequentemente, fica mais barato. A principal questão do big data não é como coletar dados - em princípio, cada um de nós hoje pode coletar e armazenar terabytes de informações - mas como trabalhar com eles. A maioria dos dados obtidos nas redes sociais (texto, voz, imagens, vídeo) não são estruturados de forma alguma, portanto, sem o aprendizado de máquina, o big data é inútil. Agora, devido ao fato de que o poder e a memória se tornaram mais baratos, a demanda por redes neurais e aprendizado profundo aumentou - finalmente aprendemos a processar grandes matrizes de dados.

Veja, por exemplo, fotos - e isso é realmente um grande volume de dados, eles podem fornecer muitas informações. Existem milhões de fotos, mas o que fazer com elas? Quais benefícios podem ser extraídos deles? Quais padrões eles permitem que você saiba? O aprendizado de máquina, na verdade, não está tão distante. Este não é um processo tão simples quanto parece: não existe tal coisa que você aperta um botão e em uma semana recebe cálculos completos.

O aprendizado direto da máquina é precedido por tarefas mais complexas. As mesmas imagens devem primeiro ser processadas corretamente (por exemplo, fotos cortadas, centralizadas; isso é importante para o aprendizado) - essa é a primeira etapa, que geralmente leva muito tempo. O segundo estágio é escolher uma arquitetura de rede adequada para resolver o problema. Grosso modo, você constrói dez redes neurais diferentes e elas fornecem dez resultados diferentes. Então você precisa avaliar de alguma forma os resultados. E depois disso, você, com alta probabilidade, retorna ao primeiro estágio. É impossível construir uma rede universal para qualquer tarefa: você a constrói do zero ou modifica uma existente. O reconhecimento facial é uma tarefa, o reconhecimento dos gatos é outro.

No processo de aprendizado de máquina, também participamos, sem saber. Por exemplo, introduzindo captcha em sites: usando o captcha, o Google treinou redes neurais para digitalizar livros.

Devemos entender que as empresas que coletam dados grandes não estão interessadas em nossos perfis pessoais. Eles precisam de dados sobre muitas pessoas diferentes que estão interessadas em algo específico. Quanto aos serviços especiais, acho que eles podem coletar dados sem recorrer a redes sociais. Eu acho que nossos medos de que estamos sendo vigiados logo passarão. Este é o novo mundo: é possível não rastrear a web, mas é difícil. É mais fácil não aparecer na Web.

FOTOS: antonsov85 - stock.adobe.com