O Google utilizou um evento em Paris para revelar alguns dos últimos avanços da IA nos seus produtos de Pesquisa e Mapas.
O evento de última hora foi visto em grande parte como uma resposta à integração dos modelos da Microsoft do OpenAI nos seus produtos. Ainda ontem, a Microsoft realizou um evento ainda mais improvisado onde anunciou que uma nova versão do ChatGPT do OpenAI – baseada no GPT-4 – será integrada no browser Edge e no motor de busca Bing.
Esperava-se que o Google fizesse um grande número de anúncios de IA na sua conferência de desenvolvedores de E/S em Maio. O evento desta semana pareceu uma tentativa precipitada e não polida do Google de lembrar ao mundo (ou, mais provavelmente, aos investidores) que é também um líder de IA e que não foi deixado para trás.
O OpenAI alegadamente activou alarmes no Google com o ChatGPT. A convite do CEO do Google Sundar Pichai, os fundadores da empresa – Larry Page e Sergey Brin – voltaram para uma série de reuniões para rever a estratégia do produto de IA do Google.
Na sequência dessas reuniões, foi alegadamente decidido que a Google irá acelerar o seu processo de revisão de IA para que possa implementar soluções mais rapidamente. No meio desses relatórios, e da despedida de investigadores de ética de alto nível da Google, muitos estão preocupados com o facto de a empresa ir apressar produtos inseguros para o mercado.
Prabhakar Raghavan, SVP no Google, liderou os procedimentos. Nas suas observações iniciais, declarou que o objectivo da Google é “melhorar significativamente a vida do maior número de pessoas possível”. Ao longo do evento, vários oradores pareceram querer realmente empurrar a narrativa de que a Google não vai correr riscos.
“Quando se trata de IA, é fundamental que traga modelos para o mundo de forma responsável”, disse Raghavan.
Pesquisa Google
A pesquisa é o pão-e-manteiga do Google. A ameaça que um ChatGPT-enhanced Bing poderia representar para o Google parece ter sido o que causou tal alarme dentro da empresa.
“A busca continua a ser o nosso maior tiro da lua”, disse Raghavan. Acrescentando, “a lua continua em movimento”.
O Google utilizou esta secção para destacar alguns dos avanços que tem vindo a fazer em segundo plano e dos quais a maioria não terá conhecimento. Isto incluiu a utilização de tradução automática de zero tiros para adicionar duas dúzias de novas línguas ao Google Translate durante o ano passado.
Outro produto que continua a ser melhorado pela IA é o Google Lente, que é agora utilizado mais de 10 mil milhões de vezes por mês.
“A câmara é o próximo teclado”, explica Raghavan. “A era da pesquisa visual está aqui”.
Liz Reid, VP de Engenharia da Google, tomou a iniciativa de fornecer uma actualização sobre o que a empresa está a fazer nesta área.
O Google Lente está a ser expandido para suportar o conteúdo de vídeo. Um utilizador pode activar a Lente, tocar em algo sobre o qual queira aprender mais num clip de vídeo (como um ponto de referência), e o Google irá trazer mais informação sobre o mesmo.
O Google ia fazer uma demonstração ao vivo de pesquisa múltipla, mas desajeitadamente perdeu o telefone. Felizmente, a empresa diz que agora está em directo a nível mundial para que você mesmo possa dar-lhe uma oportunidade.
Poucas empresas têm acesso à quantidade de informação sobre o mundo e os seus cidadãos que a Google tem. Para além dos argumentos de privacidade, permite à empresa oferecer serviços poderosos que se complementam mutuamente.
Reid diz que os utilizadores poderão tirar uma fotografia de algo como um artigo de padaria e pedir ao Google que procure um local próximo no Google Maps onde a pessoa possa deitar as mãos a um equivalente. O Google diz que essa funcionalidade está a chegar em breve a imagens em páginas de resultados de pesquisa móvel.
Bardo
Prabhakar retomou o palco para discutir a resposta do Google ao ChatGPT.
O serviço de IA de conversação do Google chama-se Bard e é alimentado por LaMDA (Language Model for Dialogue Applications).
Num exemplo de uma interacção, Prabhakar perguntou a Bard o que ele deveria considerar ao comprar um carro novo. Ele perguntou então os prós e os contras de um carro eléctrico. Finalmente, pediu a Bard que o ajudasse a planear uma viagem de carro.
O bardo está agora disponível para testadores de confiança mas o Prabhakar diz que o Google vai verificar se ele se encontra com a “barra alta” da empresa para segurança antes de uma implementação mais ampla.
A empresa diz que está a abraçar a NORA (No One Right Answer) para perguntas como, “Qual é a melhor constelação a procurar quando se olha para o estrelato?” por ser subjectiva. A IA generativa será utilizada em tais casos para trazer múltiplos pontos de vista aos resultados – o que parece bastante semelhante ao que tem vindo a fazer no Google News há algum tempo, para ajudar a abordar as preocupações tendenciosas.
Prabhakar continua a destacar o potencial para a IA generativa vai muito além do texto. O SVP salienta que o Google pode usar a IA generativa para criar uma visão de 360 graus de itens como ténis a partir de apenas um punhado de imagens.
No próximo mês, o Google começará a desenvolver a sua Generative Language API para os ajudar a aceder a algumas capacidades poderosas. Inicialmente, a API será alimentada por LaMDA. Prabhakar diz que “uma gama de modelos” se seguirá.
Google Maps
Chris Phillips, Chefe do Grupo Geo do Google, subiu ao palco para dar uma visão geral de algumas das melhorias da IA que a empresa está a trazer para o Google Maps.
Phillips diz que a IA está “a alimentar a próxima geração do Google Maps”. O Google está a usar a IA para fundir milhares de milhões de Street View e imagens do mundo real para transformar mapas 2D em “vistas multi-dimensionais” que permitirão aos utilizadores praticamente sobrevoar edifícios se estiverem a planear uma visita.
No entanto, o mais impressionante é como a IA está a permitir ao Google obter imagens 2D de locais interiores e transformá-las em 3D que as pessoas podem explorar. Um exemplo de onde isto pode ser útil é verificar um restaurante antes de uma data para ver se a iluminação e o ambiente geral são românticos:

Estão a ser feitos melhoramentos adicionais à ‘Search with Live View’ que usa AR para ajudar as pessoas a encontrar coisas próximas como ATMs.
Ao procurar por coisas como cafés, pode ver se estão abertos e até mesmo o quão ocupados estão, normalmente, todos do ponto de vista da AR.

O Google diz que está hoje a fazer a sua maior expansão de visualização ao vivo em interiores. A vista em directo de interiores está a expandir-se para 1000 novos aeroportos, estações ferroviárias e centros comerciais.
Finalmente, o Google está a ajudar os utilizadores a fazer escolhas de transporte mais sustentáveis. Phillips diz que a Google quer “fazer a escolha sustentável, a escolha fácil”.
As novas funcionalidades do Google Maps para proprietários de veículos eléctricos ajudarão no planeamento da viagem, factorizando o tráfego, o nível de carga, e o consumo de energia. As recomendações de paragem de carga serão melhoradas e um filtro de carga “muito rápido” ajudará os proprietários de VE a escolher um local onde possam ser recarregados rapidamente e seguir o seu caminho.
Ainda mais sustentável do que conduzir VE é andar a pé. O Google está a tornar as direcções das caminhadas mais “visíveis” a partir da sua visão geral do percurso. A empresa diz que está a percorrer globalmente o Android e o iOS nos próximos meses.
Prabhakar retoma o palco para realçar que o Google está “há 25 anos em busca”, mas provoca que de certa forma “está apenas a começar”. Prossegue, dizendo que mais está em obras e que o “melhor ainda está para vir”.
O Google I/O 2023 acabou de ficar muito mais excitante.
(Foto por Mitchell Luo em Unsplash)

Quer saber mais sobre IA e grandes dados dos líderes da indústria? Confira IA & Big Data Expo a decorrer em Amesterdão, Califórnia, e Londres.