Desenvolvedor do Google sobre o que as pessoas estão procurando na Internet
Todos os dias procuramos Respostas a perguntas sobre como se tornar feliz ou porque a água sob o gelo não congela. Não é o último papel na formação de nossa abordagem para os dados jogados pelos motores de busca, incluindo o Google, que na Rússia há oito anos. Wonderzine conversou com a desenvolvedora Anna Kondratieva, que agora trabalha na divisão de busca do escritório do Google em Moscou. Ela contou como a linguagem que falamos com os mecanismos de pesquisa mudou ao longo da década, por que você não deveria ter medo da publicidade contextual e por que as pessoas usam a pesquisa por voz apenas na solidão.
DE UM MOMENTO, COMO O GOOGLE FOI PARA A RÚSSIA, OITO ANOS. VOCÊ CHECK OUT, COMO E TODOS OS SISTEMAS DE BUSCA, ÍNDICE O CONTEÚDO DA INTERNET. E VOCÊ TEM UMA DECISÃO DE TER ALGUNS DADOS, COMO VOCÊ MUDOU PEDIDOS DO MOMENTO DE UMA SEMANA DO GOOGLE E NO NOSSO TEMPO. O QUE PROCURA MAIS QUE TODOS?
Em primeiro lugar, não apenas as consultas de pesquisa foram alteradas - os mecanismos de pesquisa mudaram bastante. Essas alterações estão sempre inter-relacionadas: algumas funções aparecem em um mecanismo de pesquisa, as pessoas entendem que estão lá e começam a usá-las. Às vezes, as mudanças vêm do outro lado, isto é, a pedido do usuário. Este sistema está em constante evolução. No início do desenvolvimento dos mecanismos de busca, tudo era muito simples: você digitava as palavras que queria ver e encontrava documentos que continham essas palavras. Agora os mecanismos de busca são muito mais complicados: temos mapas, temos vídeo, temos respostas diretas para perguntas. Nós tentamos entender exatamente o que o usuário pediu.
No final de 2012, o Google lançou um serviço fundamentalmente novo na Rússia, o Knowledge Graph, em russo, é chamado de Knowledge Network. Este é um banco de dados, mas não um índice de palavras-chave e endereços, mas um conjunto de artigos vinculados por links semânticos, um gráfico de fatos e links entre eles. Graças a essa estrutura, o Google não está apenas tentando encontrar informações que correspondem literalmente à solicitação, mas é capaz de responder diretamente à pergunta do usuário. Se, por exemplo, um usuário perguntar sobre um ator, tentamos fornecer o máximo de informações possível sobre esse ator - para contar por que ele é famoso, qual é seu estado civil, com quais filmes ele mais gosta, quais atores ele estava filmando. Ou seja, é um sistema muito mais complexo que a simples correspondência de uma palavra a outra.
E os usuários, por sua vez, começam a se comunicar mais livremente com o mecanismo de busca - eles começam a fazer perguntas como se estivessem perguntando ao amigo, que sabe muito. Eles não falam como antes ...
COMPRE SAUSAGEM.
Comprar salsicha também é um pedido muito difícil! Quando você diz “comprar linguiça”, o sistema deve entender que “linguiça” é um produto, e dizer “comprar” significa algum tipo de ação e, muito provavelmente, você quer ver alguma loja. É improvável que você queira comprar linguiça na Internet, provavelmente você quer saber onde há uma mercearia próxima, que está aberta agora. Isto é, não é tão fácil quanto parece.
É QUE VOCÊ ESTÁ ACOMPANHANDO PEDIDOS DE USUÁRIO OU TUDO ACONTECE AQUI? POR EXEMPLO, SE EU QUER VER COMO OLHAR A FILHA DE RYAN, Gosling e Yeva Mendez, é o suficiente para eu inserir seu nome no mecanismo de busca.
Isso mesmo, e se você inseri-los, então nas dicas de drop-down você verá que um grande número de pessoas está interessado nisso.
E COMEÇANDO, NO ZARE DO DESENVOLVIMENTO DOS EDITORES OU, POR EXEMPLO, DURANTE A EXISTÊNCIA DA ÁREA CLARA RA E SEU A TODOS UM OUTRO PROPRIETÁRIO DO SEARCH ENGINE ESTÁ COLOCADO TOTALMENTE COMPLETO COM TODOS MEUS PEDIDO: RYAN AURA LIMPEZA ESTÃO INCLUÍDOS TOTALMENTE TODOS MEUS PEDIDOS: RYAN SÃO
E com grande probabilidade, antes de você ver apenas a página da Wikipedia, e não a notícia do nascimento de uma criança. Embora ela não estivesse lá, então seria um pouco do IMDB. Ou seja, agora estamos nos ajustando aos usuários, tentando cada vez mais entender suas intenções. Não apenas distribua as correspondências mais simples, mas compreenda o que uma pessoa quer ver e resolva os problemas que surgem para ela. Ao mesmo tempo, o processo inverso também é verdadeiro. Se as pessoas entenderem que temos mapas e você pode pesquisar todos os cafés da área nesses mapas, eles começarão a fazer isso com mais frequência. Esta é uma situação em que oferta e demanda se encontram.
Há uma piada sobre o fato de que você pode subir no YouTube para ver como cozinhar sopa, e depois de meia hora para estar no universo de Stephen Hawking
Agora, no ambiente de mídia, há uma tendência como o jornalismo explicativo. Na verdade, os jornalistas tiram do Google sua função. Se você quiser entender uma situação difícil, basta ler um artigo e não fazer 150 consultas ao Google. Você não tem medo de que, devido a essa tendência, ao longo do tempo, os mecanismos de busca se transformem em apenas uma coleção de conhecimento cotidiano? Ou seja, depois de dez anos, as pessoas vão ao Google apenas para comprar algo e encontrar algo específico.
Qualquer sistema que encontre a resposta para uma pergunta é, até certo ponto, um mecanismo de busca. O oposto é a situação quando você não tem nenhuma pergunta, e você é oferecido a informação, acreditando que pode ser de interesse para você. Por exemplo, a própria revista nos dá conhecimento, não iniciamos este processo. O jornalista oferece informações sem saber se a pessoa precisa ou não. A busca é o oposto - lá o usuário é o lado ativo, ele começa a iniciar esse processo com seu pedido. Este é um sistema muito pessoal e muito multifuncional. Porque até uma pessoa tem um grande número de solicitações por um pequeno período de tempo.
Há uma piada sobre o fato de que você pode subir no YouTube para ver como cozinhar borscht, e depois de meia hora para estar no universo de Stephen Hawking e assistir a um vídeo sobre como buracos negros são feitos. Cada pessoa tem um conjunto de coisas que ele está interessado, apenas enorme - como toda uma nação e toda a humanidade. Assim, o jornalismo, que oferece informações para um determinado grupo de usuários, não pode satisfazer plenamente os interesses de pessoas de outros grupos. A consulta de pesquisa fornece informações instantâneas sobre o que lhe interessa neste momento.
Já perdemos o hábito e não nos lembramos de como era quando não havia mecanismo de busca nem Internet. Não nos lembramos desse momento: quando queríamos descobrir quem era a esposa de uma pessoa famosa ou de um personagem histórico, precisávamos ir à biblioteca, procurar esse livro - foi um processo muito difícil e muito longo. Agora fazemos isso tão rápido que nem sequer pensamos sobre o que a tecnologia está por trás disso. Por isso, tornou-se comum que não entendamos o quão importante realmente é, como nosso mundo é complementar, o quanto ele acelera nossa capacidade de aprender e receber informações.
Quantas vezes por dia uma pessoa google em média?
O Google processa uma média de 40 mil solicitações por segundo. Claro, não podemos dizer quantas vezes uma pessoa recorre ao Google.
Há alguma diferença entre as consultas do sexo masculino e feminino do Google?
Se você olhar de perto, especialmente em várias solicitações seguidas, provavelmente poderá adivinhar quais foram os pedidos. Se eles perguntarem como preparar um bolo, então, muito provavelmente, ainda é uma mulher, e se eles perguntarem como cozinhar salsichas, então, muito provavelmente, um homem. Mas isso, claro, é uma avaliação muito superficial, na verdade, não sabemos quem está por trás desse ou daquele pedido. Temos muito cuidado com os dados pessoais do usuário. Por exemplo, nem eu nem nenhum dos engenheiros podemos descobrir que tipo de pessoa eu estava procurando - é absolutamente impossível.
Recentemente, houve uma série de artigos que o Google sabe sobre você que você não conhece sobre si mesmo. Honestamente, tenho a mesma impressão às vezes. Quando você analisa minhas consultas de pesquisa e, em seguida, com base nisso você me dá publicidade contextual, eu penso: droga, o Big Brother está me observando.
Quando os usuários nos fornecem dados, por exemplo, registrando uma Conta do Google, nós a usamos para melhorar os serviços e torná-los ainda mais convenientes. Com esses dados, mostramos resultados de pesquisa e publicidade mais relevantes e fornecemos a capacidade de compartilhar informações facilmente. Ao mesmo tempo, sempre nos certificamos de que os usuários entendam como os dados são usados e como proteger sua privacidade. Em particular, cada usuário pode gerenciar determinados tipos de informações em uma Conta do Google usando a "Minha conta", personalizar a aparência do perfil do Google usando um editor, controlar o acesso de outras pessoas aos dados e assim por diante.
A publicidade é um sistema completamente separado que funciona sem intervenção humana. Ou seja, toda a informação que processa, não mostra ninguém. Portanto, como engenheiros de pesquisa, não temos acesso a esses dados. Tudo o que acontece em Vegas fica em Vegas. Assim, tudo o que acontece na publicidade permanece apenas na publicidade. Não há como permitir que pelo menos algumas informações sejam extraídas de lá. A publicidade pode supor que você é uma mulher. Mas ninguém pode usar essa informação de maneira alguma. Esta é uma posição fundamental da empresa, porque é ruim para nós e ruim para os usuários. Além disso, o usuário pode alterar as configurações de suas preferências de publicidade, incluindo as categorias de interesse, além de recusar determinados serviços de publicidade do Google.
Pelo que entendi, você está diretamente envolvido na pesquisa por voz. Eu nunca vi ninguém usar uma busca por voz, nunca em todos. É quando as pessoas estão dirigindo e precisam urgentemente saber o endereço.
O fato é que quando alguém olha para você, é menos natural falar com o telefone. Em locais públicos, as pessoas preferem manter sua privacidade e não mais se comunicar com o telefone por meio de uma voz. Mas há situações em que é absolutamente necessário. Por exemplo - apenas o que você trouxe ao dirigir um carro. Eu não dirijo e não sei como fazemos isso, mas nos EUA, por exemplo, isso é uma violação da lei se uma pessoa ativa o celular enquanto dirige. Se uma pessoa precisa de alguma coisa enquanto dirige um carro, então a única maneira é usar a pesquisa por voz, simplesmente não há outra maneira. E isso é certo, porque há situações em que você simplesmente não pode segurar o telefone em suas mãos. Além disso, há situações em que você precisa obter algo rapidamente, porque a digitação é mais difícil e mais lenta do que perguntar com uma voz. Existem pessoas com deficiências, há quem ache difícil entrar nessas pequenas chaves.
Ainda assim, a busca por voz é um recurso relativamente novo que apareceu há não muito tempo, os usuários continuam a abri-lo, eles continuam a explorar como ele funciona. Eles continuam a encontrar situações em que isso seria mais conveniente. Por apenas 15 anos, os usuários procuram algo na Internet, preenchendo textos em janelas de busca e, ao longo de 15 anos, desenvolveram um hábito. Em situações em que seria mais conveniente perguntar ao telefone dessa maneira, eles não o fazem, porque o poder do hábito supera. Leva algum tempo para se adaptar, para entender como encaixar novos cenários nos habituais. Mas, claro, há mais chamadas de voz, as pessoas aprendem a usá-lo em uma variedade de situações.
Se lhe perguntarem como preparar um bolo, então, provavelmente, é uma mulher. E se eles perguntam como cozinhar salsichas, então, muito provavelmente, um homem
Você aprende a interação do usuário com um mecanismo de pesquisa. Parece compreensível, mas se mais detalhadamente - você está aprendendo o que o usuário quer ver em um mecanismo de busca?
Sim Na verdade, estudo o que ele quer. Mesmo não necessariamente o que ele quer ver, mas que tipo de reação o usuário espera do mecanismo de busca. Porque quanto mais longe, mais natural se torna a linguagem da interação. Por exemplo, uma coisa é que, quando você vai em uma jornada, pergunte quantos diplomas estão em Milão e pergunte "que horas são", e o mecanismo de busca entenderá que você está interessado no tempo em Milão - isso é uma reminiscência de como uma pessoa conversando com outra pessoa. Esse é um discurso mais natural, que nos deixa menos distraídos com a construção da frase.
Ou seja, quanto mais natural for a fala, mais naturais as respostas em linguagem natural que somos capazes de fornecer, mais fazemos com que esse processo de interação humana com o conhecimento contido na Internet seja suave e transparente. Uma pessoa não precisa pensar quais palavras escolher, qual escolher para a solicitação. Ou seja, nós fazemos com que uma pessoa se comunique com um mecanismo de busca enquanto ele se comunica com um amigo ou amigo de infância. Por isso, estou empenhado em entender o que as pessoas estão pedindo e respondendo a elas para que não pareçam desajeitadas.
Você colabora com linguistas para estudar como a linguagem muda?
Sem dúvida, linguistas são necessários. Mas o fato é que qualquer pessoa que fala sua língua nativa entende quando ele é falado com a linguagem correta. Mesmo que alguém cometa um erro e construa a frase de forma incorreta, sempre entendemos o que é o russo letrado. Portanto, é claro, nós temos nossos próprios linguistas, temos pessoas com experiência em linguística computacional. Naturalmente, temos uma pilha de livros que podem dizer como construir uma frase nos casos mais difíceis quando nós, como pessoas educadas, nos encontramos em um beco sem saída.
Do ponto de vista da linguística, desde a chegada do Google na Rússia, como as necessidades humanas mudaram, qual é a tendência atual?
A linguagem tornou-se mais compreensível, mais verbal, por assim dizer. Solicitações tornaram-se conversacionais. Quando em 2004-2005 todos os sistemas operacionais estavam em seu período de infância, o usuário tentou formular consultas para os mecanismos de busca na linguagem do pássaro, em uma linguagem de pesquisa, não na linguagem natural. Eles estão acostumados a usar palavras no caso nominativo, não a harmonizar frases, isto é, simplesmente nomear um conjunto de palavras que gostariam de ver nos documentos. Se antes você diria "previsão do tempo de Moscou", agora você pode dizer "previsão do tempo de Moscou", "o que é o tempo em Moscou?", E isso soa como uma pergunta normal. Em segundo lugar, a busca por esse tempo ganhou serviços adicionais. Havia vídeos, mapas, busca de fotos, pessoas começando a procurar endereços. No final, agora uma pessoa pode perguntar: "Por que a água não congela sob o gelo?" e obtenha uma resposta.
A Getty Images lançou o projeto Lean In - essa é uma biblioteca de fotos que retrata mulheres de várias profissões. seu objetivo - destruir estereótipos sobre as mulheres. O Google tem projetos semelhantes?
Na verdade, o Google está fazendo muito para que as garotas venham para a TI e construam uma carreira de sucesso nessa área. Por exemplo, o Google fundou uma bolsa de estudos chamada Anita Borg, concedida anualmente às meninas mais poderosas - estudantes no campo da ciência da computação. E em março deste ano, o Google lançou a série de eventos Women Techmakers - mais de 100 reuniões em 52 países ao redor do mundo, durante as quais garotas puderam participar de workshops de planejamento de carreira e compartilhar experiências com as principais especialistas do setor de tecnologia. E em nossa empresa há muitas engenheiras que ocupam altos cargos.
Como sua vida mudou pessoalmente enquanto trabalhava no Google?
Antes de tudo, me acostumei a um ambiente de trabalho confortável. Inclui as pessoas com quem trabalho, os projetos que fazemos e como este trabalho é organizado; disponibilidade de uma enorme quantidade de informações e poder de computação, e apenas condições de vida no escritório. De certa forma, a atmosfera local é semelhante à atmosfera de um campus estudantil com sua hierarquia mínima, com muitos planos e idéias, e com uma ampla variedade de conhecimentos e interesses.