O mais novo modelo da OpenAI é GPT-4o – SofolFreelancer


A OpenAI está lançando um novo modelo de IA generativa chamado GPT-4o, definido para ser implementado “iterativamente” nos produtos da empresa para desenvolvedores e consumidores nas próximas semanas.

O CTO da OpenAI, Muri Murati, disse que o GPT-4o fornece inteligência de “nível GPT-4”, mas melhora os recursos do GPT-4 em texto e visão, bem como em áudio.

“O GPT-4o raciocina através de voz, texto e visão”, disse Murati em uma apresentação nos escritórios da OpenAI.

GPT-4, o modelo líder anterior da OpenAI, foi treinado em uma combinação de imagens e texto e podia analisar imagens e texto para realizar tarefas como extrair texto de imagens ou até mesmo descrever o conteúdo dessas imagens. Mas o GPT-4o acrescenta fala à mistura.

O que, concretamente, isso permite? Uma série de coisas.

GPT-4o melhora muito a experiência do ChatGPT – ChatGPT é o chatbot viral da OpenAI com tecnologia de IA. O ChatGPT oferece há muito tempo um modo de voz que transcreve texto do ChatGPT usando um modelo de conversão de texto em fala. O GPT-4o potencializa isso, permitindo que os usuários interajam com o ChatGPT como um assistente.

Por exemplo, os usuários podem fazer uma pergunta ao ChatGPT – desenvolvido com GPT-4o – e interromper o ChatGPT enquanto ele responde. O modelo oferece capacidade de resposta em “tempo real”, diz OpenAI, e pode até captar a emoção na voz do usuário – e gerar voz em “uma variedade de estilos emotivos diferentes”.

Em outras notícias, a OpenAI está lançando uma versão desktop do ChatGPT e uma interface de usuário atualizada.

“Sabemos que esses modelos [are getting] cada vez mais complexo, mas queremos que a experiência de interação se torne realmente mais natural, fácil, e que você não se concentre na interface do usuário, mas apenas na colaboração com [GPTs]Murti disse.

Leave a Reply