Por Max A. Cherney e Jeffrey Dastin
MOUNTAIN VIEW, Califórnia, – A Alphabet, controladora do Google, mostrou na terça-feira como está desenvolvendo inteligência artificial em seus negócios, incluindo um chatbot Gemini reforçado e melhorias na pesquisa, enquanto corre para competir com rivais de IA.
A enxurrada de anúncios ressalta os esforços do Google para atualizar seus produtos desde que o lançamento do ChatGPT pela OpenAI em 2022, apoiado pela Microsoft, deslumbrou o público, ameaçando o longo reinado do titular sobre a pesquisa online e a IA.
Entre as últimas salvas do Google estava uma adição à sua família de modelos Gemini 1.5 AI, conhecida como Flash, que é mais rápida e barata de executar; um protótipo chamado Projeto Astra, que pode conversar com os usuários sobre qualquer coisa capturada pela câmera do smartphone em tempo real; e resultados de pesquisa categorizados em títulos gerados por IA.
“Este é um momento de crescimento e oportunidade”, disse o CEO da Alphabet, Sundar Pichai, aos repórteres, quando questionado se as atualizações de IA poderiam colocar em risco os negócios lucrativos do Google.
A apresentação do produto no evento anual de desenvolvedores de I/O do Google em Mountain View, Califórnia, seguiu-se a uma apresentação mais curta da rival OpenAI na segunda-feira. A OpenAI demonstrou como o ChatGPT poderia dar respostas com entonação humana a qualquer solicitação escrita ou visual. O CEO da startup, Sam Altman, escreveu que a OpenAI entregou um software que “parece a IA dos filmes”.
As notícias do Google às vezes cobriam terreno semelhante, ressaltando a competição acirrada entre os dois desenvolvedores de IA.
Por exemplo, a unidade de IA da Alphabet, Google DeepMind, tem trabalhado para construir tecnologia que possa realizar tarefas diárias para os consumidores. Os primeiros resultados manifestaram-se no Project Astra, uma ferramenta que pode utilizar a câmara de um smartphone e tirar conclusões sobre o mundo à sua volta.
Em um vídeo de demonstração mostrado durante o Google I/O, um usuário o implantou para identificar um alto-falante e localizar óculos que haviam deixado em outra parte da sala. A empresa também sugeriu como poderia combinar o Projeto Astra com o que chama de Gemini Live, um auxiliar de voz e texto com som potencialmente mais natural do que o Google Assistant do passado.
Demis Hassabis, CEO do Google DeepMind, disse sobre o trabalho por trás do Projeto Astra: “Queríamos construir um agente universal de IA que pudesse ser verdadeiramente útil na vida cotidiana”.
Outra área em que o Google mostrou como está enfrentando concorrentes foi a geração de vídeos. A empresa lançou o Veo, um modelo de IA que pode gerar vídeos com resolução de 1080p com duração superior a um minuto, disponível para criadores aprovados com base em pré-visualização, entre eles o cineasta Donald Glover. A OpenAI promoveu seu próprio software de criação de filmes entre os executivos de Hollywood, encantando e preocupando a indústria criativa.
O Google anunciou melhorias em seu modelo Gemini Pro 1.5, que é capaz de compreender uma enorme quantidade de dados. Na terça-feira, o Google disse que estava dobrando esse valor, para 2 milhões de tokens, o que significa que a IA poderia potencialmente responder a perguntas quando recebesse milhares de páginas de texto ou mais de uma hora de vídeo para ingerir.
O modelo Pro – começando com tamanhos de prompt de até 1 milhão de tokens, ou dados – também estará disponível para assinantes do serviço Gemini Advanced do Google.
As ações da Alphabet subiram 1%, para US$ 172,59, na tarde de terça-feira.
NOVO CHIP, NOVA PESQUISA
O Google também esclareceu seus esforços para potencializar a IA com novos chips de computação e renovar seu mecanismo de busca homônimo.
A empresa anunciou uma unidade de processamento tensor de sexta geração, que visa oferecer a ela e a seus clientes do Google Cloud uma alternativa aos poderosos processadores da Nvidia, peso pesado da indústria. O novo chip estará disponível para seus clientes em nuvem no final de 2024, disse o Google.
Enquanto isso, para os usuários norte-americanos da Pesquisa Google que navegam na Web em inglês, a empresa disse que em breve usará IA para ajudar a organizar os resultados da pesquisa para consultas sobre restaurantes, receitas e, eventualmente, filmes, livros e outros conteúdos.
Também para a pesquisa do Google, a empresa está lançando visões gerais de IA para todos os usuários nos EUA esta semana, após um longo período de testes públicos desde o evento I/O do ano passado. O recurso usa IA generativa para sintetizar informações e responder a consultas mais complexas para as quais não há uma resposta simples na web.
Os anúncios permanecerão em espaços em uma determinada página do Google, disse a empresa, e as visões gerais da IA serão implementadas para mais de um bilhão de pessoas até o final do ano.
A Alphabet registrou receita de US$ 307,4 bilhões em 2023, a maioria proveniente de anúncios na Pesquisa Google e outras propriedades.
A empresa também exibiu um experimento que permitirá aos usuários fazer perguntas sobre os vídeos que enviam para a Pesquisa Google, como fazem hoje com as imagens. A empresa demonstrou como isso poderia ajudar a diagnosticar o que há de errado com um toca-discos quebrado.
Este artigo foi gerado a partir de um feed automatizado de uma agência de notícias sem modificações no texto.