Pinecone lança seu banco de dados vetorial sem servidor fora da versão prévia – SofolFreelancer


Pinha, a startup de banco de dados vetorial fundada por Edo Liberty, ex-chefe do AI Labs da Amazon, está há muito tempo na vanguarda em ajudar empresas a aumentar grandes modelos de linguagem (LLMs) com seus próprios dados. Mais recentemente, porém, a empresa reprojetou completamente seu produto para lançar o Pinecone Serverless, que libera seus clientes de ter que pensar em gerenciar suas implantações e escalá-las. Hoje, o Pinecone serverless sai da versão beta e já está disponível para todos.

Liberty observa que os primeiros clientes da empresa estão agora fazendo a transição da experiência com IA generativa para o desejo de lançar seus próprios produtos de IA. A empresa observou as empresas lidarem com a complexidade da criação de novos aplicativos, ao mesmo tempo em que descobriam a melhor forma de colocá-los em produção.

“A primeira onda de aplicações de nível de produção está chegando ao mercado agora e nos próximos seis a nove meses. O que nossos mais de 5.000 clientes nos disseram em alto e bom som é que eles precisam de uma ferramenta dedicada, otimizada, especializada e extremamente boa para fazer busca vetorial, fazer RAG, extrair conhecimento e gerar contexto para esses modelos de linguagem. O que eles estavam realmente dizendo é: ei, preciso de escala, preciso de desempenho e preciso que os custos sejam tais que eu possa raciocinar sobre o produto que estou construindo.”

Créditos da imagem: Pinha

Liberty enfatizou que a Pinecone gastou muito tempo preparando o produto para implantações de produção – ao mesmo tempo que o tornou significativamente mais acessível. Na verdade, a empresa acredita que os clientes que usam o Pinecone sem servidor podem reduzir seus custos em até 50 vezes, em parte porque a equipe reprojetou o sistema para ser um serviço multilocatário que separa armazenamento e computação. Com isso, os clientes da Pinecone só pagam quando realmente consomem tempo de CPU, com a empresa orquestrando a capacidade no backend.

“Como administramos tudo como um serviço, nossa capacidade de orquestrar tudo isso nos torna capazes de cobrar das pessoas exatamente o que elas usam – e nada mais. Isso é incrivelmente raro e difícil de fazer”, disse Liberty.

Fundador da Pinecone, Edo Liberty.
Fundador da Pinecone, Edo Liberty.
Créditos da imagem: Pinha

Durante a pré-visualização pública, os clientes da Pinecone também solicitaram uma série de recursos adicionais. Um deles é o Private Endpoints, que está sendo lançado hoje em versão prévia pública. Isso permite que as empresas criem uma conexão direta com suas nuvens privadas virtuais na Amazon por meio do AWS PrivateLink, que não expõe seus dados à Internet pública para garantir que os dados permaneçam dentro dos vários regimes de governança e conformidade aos quais uma empresa pode ter que aderir. .

Algumas das empresas que já usam o Pinecone serverless incluem Gong, Help Scout, New Relic, Notion, TaskUS e You.com.

“A Notion está liderando a revolução da produtividade da IA”, disse o cofundador e COO da Notion, Akshay Kothari. “Nosso lançamento de um recurso de IA pioneiro no mercado foi possível graças ao Pinecone serverless. Sua tecnologia permite que nossa IA de perguntas e respostas forneça respostas instantâneas a milhões de usuários, provenientes de bilhões de documentos. O melhor de tudo é que a nossa mudança para a sua arquitetura mais recente reduziu os nossos custos em 60%, avançando a nossa missão de tornar a criação de ferramentas de software omnipresente.”

Leave a Reply