Tech

Anthropic afirma que seu modelo mais recente é o melhor da categoria

OpenAI rival Antrópico está lançando um novo e poderoso modelo de IA generativo chamado Claude 3.5 Sonnet. Mas é mais um passo incremental do que um salto monumental em frente.

Claude 3.5 Sonnet pode analisar texto e imagens, bem como gerar texto, e é o modelo de melhor desempenho da Antrópico até agora – pelo menos no papel. Em vários benchmarks de IA para leitura, codificação, matemática e visão, Claude 3.5 Sonnet supera o modelo que está substituindo, Claude 3 Sonnet, e supera o modelo carro-chefe anterior da Anthropic Cláudio 3 Opus.

Referências não são necessariamente a medida mais útil do progresso da IA, em parte porque muitos deles testam casos extremos esotéricos que não são aplicáveis ​​à pessoa comum, como responder a perguntas de exames de saúde. Mas se valer a pena, Claude 3.5 Soneto apenas um pouco supera modelos líderes rivais, incluindo o recentemente lançado da OpenAI GPT-4onos benchmarks contra os quais a Antrópica testou.

Juntamente com o novo modelo, a Anthropic está lançando o que chama de Artefatos, um espaço de trabalho onde os usuários podem editar e adicionar conteúdo – por exemplo, código e documentos – gerado pelos modelos da Anthropic. Atualmente em versão prévia, os Artefatos ganharão novos recursos, como formas de colaborar com equipes maiores e armazenar bases de conhecimento, em um futuro próximo, afirma a Anthropic.

Foco na eficiência

Claude 3.5 Sonnet tem um desempenho um pouco melhor do que Claude 3 Opus, e Anthropic diz que o modelo entende melhor instruções complexas e diferenciadas, além de conceitos como humor. (IA é notoriamente sem graça, no entanto.) Mas talvez mais importante para desenvolvedores que criam aplicativos com Claude que exigem respostas imediatas (por exemplo, chatbots de atendimento ao cliente), o 3.5 Sonnet é mais rápido. É cerca de duas vezes a velocidade do 3 Opus, afirma a Antrópica.

A visão – análise de fotos – é uma área onde o Claude 3.5 Sonnet melhora muito em relação ao 3 Opus, de acordo com a Anthropic. O 3.5 Sonnet pode interpretar tabelas e gráficos com mais precisão e transcrever texto de imagens “imperfeitas”, como fotos com distorções e artefatos visuais.

Michael Gerstenhaber, líder de produto da Anthropic, diz que as melhorias são o resultado de ajustes arquitetônicos e novos dados de treinamento, incluindo dados gerados por IA. Quais dados especificamente? Gerstenhaber não quis revelar, mas deu a entender que Claude 3.5 Sonnet extrai grande parte da sua força destes conjuntos de treino.

Créditos da imagem: Antrópico

“O que importa [businesses] é se a IA os está ajudando ou não a atender às suas necessidades de negócios, e não se a IA é competitiva ou não em um benchmark”, disse Gerstenhaber ao TechCrunch. “E dessa perspectiva, acredito que o Claude 3.5 Sonnet será um passo à frente de qualquer outra coisa que temos disponível – e também à frente de qualquer outra coisa na indústria.”

O sigilo em torno dos dados de treinamento pode ser por razões competitivas. Mas também poderia ser para proteger a Antrópica de desafios legais – em particular desafios relativos a uso justo. Os tribunais ainda não decidiram se fornecedores como a Anthropic e os seus concorrentes, como OpenAI, Google, Amazon e assim por diante, têm o direito de treinar em dados públicos, incluindo dados protegidos por direitos autorais, sem compensar ou creditar os criadores desses dados.

Então, tudo o que sabemos é que o Claude 3.5 Sonnet foi treinado em muitos textos e imagens, como os modelos anteriores da Anthropic, além de feedback de testadores humanos para tentar “alinhar” o modelo com as intenções dos usuários, evitando que ele emita substâncias tóxicas ou não. texto problemático.

Soneto antrópico de Claude 3.5
Créditos da imagem: Antrópico

O que mais sabemos? Bem, a janela de contexto do Claude 3.5 Sonnet – a quantidade de texto que o modelo pode analisar antes de gerar um novo texto – é de 200.000 tokens, o mesmo que 3 Sonnet. Tokens são pedaços subdivididos de dados brutos, como as sílabas “fan”, “tas” e “tic” na palavra “fantástico”; 200.000 tokens equivalem a cerca de 150.000 palavras.

E sabemos que o Soneto Claude 3.5 está disponível hoje. Usuários gratuitos do cliente web da Anthropic e do aplicativo Claude iOS podem acessá-lo gratuitamente; assinantes dos planos pagos da Antrópico Claude Pro e Equipe Cláudio obtenha limites de taxa 5x mais altos. O 3.5 Sonnet também está disponível na API da Anthropic e em plataformas gerenciadas como Amazon Bedrock e Vertex AI do Google Cloud.

“Claude 3.5 Sonnet é realmente uma mudança radical na inteligência sem sacrificar a velocidade, e nos prepara para lançamentos futuros ao longo de toda a família de modelos Claude”, disse Gerstenhaber.

O Claude 3.5 Sonnet também impulsiona o Artifacts, que abre uma janela dedicada no cliente web do Claude quando um usuário solicita ao modelo para gerar conteúdo como trechos de código, documentos de texto ou designs de sites. Gerstenhaber explica: “Artefatos são a saída do modelo que coloca o conteúdo gerado de lado e permite que você, como usuário, itere nesse conteúdo. Digamos que você queira gerar código — o artefato será colocado na interface do usuário e então você poderá conversar com Claude e iterar no documento para melhorá-lo e poder executar o código.”

A figura maior

Então, qual é o significado do Soneto Claude 3.5 no contexto mais amplo do Antrópico – e do ecossistema de IA, nesse caso?

Claude 3.5 Sonnet mostra que o progresso incremental é a extensão do que podemos esperar agora na frente do modelo, salvo um grande avanço na investigação. Nos últimos meses, assistimos a lançamentos importantes do Google (Gêmeos 1.5 Pró) e OpenAI (GPT-4o) que movem o ponteiro marginalmente em termos de benchmark e desempenho qualitativo. Mas não houve um salto correspondente ao salto de GPT-3 para GPT-4 dentro de algum tempo, devido à rigidez das arquiteturas de modelos atuais e à imensa computação que elas exigem para treinar.

À medida que os fornecedores de IA generativa voltam sua atenção para curadoria de dados e licenciamento em vez de novas arquiteturas escaláveis ​​promissoras, há sinais de que os investidores estão ficando cautelosos do caminho mais longo do que o previsto para o ROI da IA ​​generativa. A Antrópica está um tanto inoculada dessa pressão, estando na invejável posição de Amazonas (e em menor grau do Google) seguro contra OpenAI. Mas a receita da empresa, prevista para atingir pouco menos de US$ 1 bilhão até o final de 2024, é um fração do OpenAI – e tenho certeza que os apoiadores do Anthropic não deixam esquecer esse fato.

Apesar de uma base crescente de clientes que inclui marcas familiares como Bridgewater, Brave, Slack e DuckDuckGo, a Anthropic ainda carece de um certo prestígio empresarial. Notavelmente, foi OpenAI – não Antrópico – com o qual A PwC firmou recentemente uma parceria para revender ofertas generativas de IA para a empresa.

Portanto, a Anthropic está adotando uma abordagem estratégica e bem conhecida para fazer incursões, investindo tempo de desenvolvimento em produtos como o Claude 3.5 Sonnet para oferecer um desempenho ligeiramente melhor a preços de commodities. O 3.5 Sonnet tem o mesmo preço do 3 Sonnet: US$ 3 por milhão de tokens inseridos no modelo e US$ 15 por milhão de tokens gerados pelo modelo.

Gerstenhaber falou sobre isso em nossa conversa. “Quando você está construindo um aplicativo, o usuário final não deveria precisar saber qual modelo está sendo usado ou como um engenheiro otimizou sua experiência”, disse ele, “mas o engenheiro pode ter as ferramentas disponíveis para otimizar essa experiência”. ao longo dos vetores que precisam ser otimizados, e o custo é certamente um deles.”

Soneto de Cláudio 3.5 não resolve o problema das alucinações. É quase certo que comete erros. Mas pode ser atraente o suficiente para fazer com que desenvolvedores e empresas mudem para a plataforma da Anthropic. E no final das contas, é isso que importa para a Antrópica.

Para esse mesmo fim, a Anthropic dobrou a aposta em ferramentas como seu direção experimental AIque permite aos desenvolvedores “dirigir” os recursos internos de seus modelos; integrações para permitir que seus modelos executem ações dentro de aplicativos; e ferramentas construídas em cima de seus modelos, como a já mencionada experiência de Artefatos. Também contratou um cofundador do Instagram como chefe de produto. E os seus ampliou a disponibilidade de seus produtos, mais recentemente trazendo Claude para a Europa e estabelecendo escritórios em Londres e Dublin.

A Anthropic, no geral, parece ter chegado à ideia de que construir um ecossistema em torno de modelos – e não simplesmente modelos isolados – é a chave para reter clientes à medida que a lacuna de capacidades entre os modelos diminui.

Ainda assim, Gerstenhaber insistiu que modelos maiores e melhores – como o Claude 3.5 Opus – estão no horizonte próximo, com recursos como pesquisa na web e a capacidade de lembrar preferências a reboque.

“Eu não vi o aprendizado profundo ainda atingiu uma parede, e deixarei que os pesquisadores especulem sobre o muro, mas acho que é um pouco cedo para tirar conclusões sobre isso, especialmente se você observar o ritmo da inovação”, disse ele. “Há um desenvolvimento muito rápido e uma inovação muito rápida, e não tenho motivos para acreditar que irá desacelerar.”

Veremos.

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button