Gemini 3 + Google Antigravity

20 de novembro de 2025

O que há de novo?

  • Google lançou o Gemini 3, o melhor modelo multimodal do mundo (até o momento)
  • Google Antigravity, uma plataforma de desenvolvimento baseada em agentes.
  • Existe também o modo “Deep Thinking” do Gemini 3, voltado a raciocínios mais profundos, que ainda está em fase de testes.

Por que isso importa?

  • O Gemini 3 Pro supera suas versões anteriores (Gemini 2.5 Pro) e vários concorrentes como GPT‑5.1 e Claude Sonnet 4.5 em muitos benchmarks.

Gemini 3 Benchmark

Destaque para:

  • Humanity’s Last Exam (mede raciocínio acadêmico), atingiu 37,5%, sem uso de ferramentas, frente a 26,5% do GPT-5.1, mostrando vantagem clara em tarefas de raciocínio profundo.

  • ARC-AGI-2 (focado em raciocínio visual e generalização), atingiu 31,1%, superando GPT-5.1 (17,6%) e Claude (13,6%), destacando desempenho superior em abstração e resolução de padrões.

  • GPQA Diamond (conhecimento científico avançado), atingiu 91,9%, acima do GPT-5.1 (88,1%), evidenciando domínio sólido em áreas técnicas.

  • Terminal-Bench 2.0 (avalia agentes de terminal), atingiu 54,2%, superando GPT-5.1 (47,6%) e Claude (42,8%), indicando maior capacidade de executar tarefas complexas em ambiente de linha de comando.

  • Vending-Bench 2 (capacidade do modelo de operar tarefas extensas ao longo do tempo), atingiu US$ 5.478,16 de retorno médio, resultado muito superior ao GPT-5.1 (US$ 1.473,43) e ao Claude (US$ 3.838,74), reforçando que o Gemini 3 Pro se destaca em tarefas de longo horizonte que exigem planejamento consistente, múltiplas ações e estratégia contínua.

Sobre o Antigravity:

  • Nova IDE para desenvolvimento com um conjunto de agentes que operam o editor, terminal e browser.
  • Os agentes planejam e executam tarefas, se comunicando via artifacts (um documento markdown com as especificações e evidências).
  • O Google apresenta a plataforma como “Desenvolva qualquer coisa”

O que eu estou pensando?

  • Tem sido cada vez mais fácil construir coisas e materializar nossas ideias.
  • Penso que agora o desafio está mudando de “como construir” para “o que construir”.
  • A visão de produto, modelo de negócio, experiência do usuário, vantagens competitivas e product-market fit se tornam ainda mais importantes para manter um negócio relevante.
  • Apesar das evoluções nos benchmarks, até onde conseguiremos ir com as arquiteturas atuais (transformers)?

Veja mais em: