Principais fabricantes estrangeiros de grandes modelos lançam novos produtos concentradamente

Carlos
5minutosTempo de leitura
Principais fabricantes estrangeiros de grandes modelos lançam novos produtos concentradamente
Principais fabricantes estrangeiros de grandes modelos lançam novos produtos concentradamenteA, OpenAI lançou open-source dois modelos de raciocínio, gpt-oss-120b e gpt-oss-20b.

Principais fabricantes estrangeiros de grandes modelos lançam novos produtos concentradamente

粘贴的图片

Na madrugada de 6 de agosto, horário de Pequim, vários fabricantes estrangeiros de grandes modelos tomaram ações frequentes e lançaram seus produtos mais recentes, causando novamente uma onda no campo da inteligência artificial.​

A startup de IA Anthropic lançou o Claude Opus 4.1. Segundo a Anthropic, este modelo é uma versão atualizada do Claude Opus 4 em termos de tarefas de agente, codificação no mundo real e raciocínio. A empresa declarou que, no passado, se concentrava apenas em lançar atualizações importantes de versão, e o lançamento do Claude Opus 4.1 desta vez significa que a empresa mudará para promover melhorias incrementais nos modelos de codificação no futuro, e mais atualizações serão lançadas nas próximas semanas. Em termos de desempenho, no teste de benchmark SWE-bench Verify, o Claude Opus 4.1 obteve uma pontuação de 74,5%, superando a de 72,5% do Opus 4, o que indica uma melhoria na capacidade de codificação. Além disso, as pontuações do modelo nos testes de benchmark Terminal-Bench (programação de terminal de agente), GPQA Diamond (capacidade de raciocínio em nível de pós-graduação) e MMMLU (resposta a perguntas multilíngues) também superaram as do Opus 4.​

A Google lançou a nova geração do modelo mundial Genie 3. A Google declarou que o Genie 3 é o primeiro modelo mundial da empresa que suporta interação em tempo real, e o modelo mundial é um passo fundamental para a AGI (Inteligência Artificial Geral). Ele permite que os agentes de IA treinem sem restrições em ambientes simulados ricos e também fornece um local para o treinamento de robôs. O Genie 3 pode gerar ambientes interativos diversificados. Sua modelagem das características físicas do mundo pode simular fenômenos naturais como água e luz, gerar ecossistemas contendo animais e plantas, criar personagens animados e simular as interações de vários elementos em ambientes complexos. No entanto, a Google também apontou que, embora o Genie 3 tenha ultrapassado os limites de capacidade dos modelos mundiais, ainda possui limitações, como espaço de ação executável limitado e dificuldade em simular interações multiagente em um ambiente compartilhado.​

A OpenAI lançou open-source dois modelos de raciocínio, gpt-oss-120b e gpt-oss-20b, o que também é a primeira vez que a OpenAI lança modelos open-source em seis anos. Em abril deste ano, o CEO da OpenAI, Sam Altman, declarou que é "muito importante" lançar novos modelos open-source poderosos e com capacidade de raciocínio. Os dois modelos open-source desta vez cumpriram essa promessa. Sam Altman disse que eles são resultados de pesquisa da OpenAI que custaram bilhões de dólares. Entre eles, o gpt-oss-120b tem 117 bilhões de parâmetros, adota a arquitetura MoE (Mixture of Experts), com 5,1 bilhões de parâmetros ativados; o gpt-oss-20b tem 21 bilhões de parâmetros, também usando a arquitetura MoE, com 3,6 bilhões de parâmetros ativados. De acordo com os resultados dos testes de benchmark lançados pela OpenAI, o desempenho de raciocínio de ambos os modelos está entre o primeiro escalão dos modelos open-source. Vale notar que o foco da atualização da OpenAI desta vez não está apenas no open-source, mas também em permitir que os novos modelos sejam implantados localmente em dispositivos de borda, como computadores e telefones móveis. O gpt-oss-120b pode ser executado em uma única GPU de 80GB, e o gpt-oss-20b pode ser executado em dispositivos consumidores com 16GB de memória.​

Os cenários de uso dos novos produtos desses três grandes fabricantes de modelos são diferentes, mas por meio deste lançamento de novos produtos, não é difícil perceber que tanto a OpenAI quanto a Anthropic fizeram alterações em suas estratégias de produtos. Embora o GPT-5, que marca a iteração de grandes modelos básicos, ainda não tenha sido lançado, essas atualizações frequentes de grandes modelos mostram que as capacidades da IA estão sendo continuamente atualizadas, e a disponibilidade de grandes modelos também está aumentando.

Compartilhar Notícias