Radar quinzenal de IA

Curadoria com as principais novidades em aplicações e modelos

Bom dia!

A IA está em todo lugar, mas acompanhar tudo pode ser demais.

Por isso, criamos uma edição quinzenal só com o que interessa: um resumo claro e direto das novidades mais importantes em ferramentas e aplicações de IA.

O que você vai ver hoje:

  • Novidades Google Cloud Next

  • Llama 4: modelo mais potente da Meta

  • Assistentes de IA nos smartphones

  • Infográfico da edição

NOVIDADES DO GOOGLE CLOUD NEXT
O evento do Google trouxe uma série de anúncios em IA:

  • Lançamento oficial da família Gemini 2.5, contando com o modelo Pro e o Flash. Os modelos ocupam o primeiro e o terceiro lugar no LM Arena (Chatbot Arena) respectivamente.

  • Novos modelos de vídeo, imagem, fala e geração de música. Menção especial para o Veo 2 que é o estado da arte em geração de vídeo. O Chirp 3 agora permite criar vozes personalizadas instantaneamente a partir de apenas 10 segundos de áudio e traz melhorias na transcrição com múltiplos speakers. Já o Imagen 3 apresenta geração de imagens com qualidade superior e novas funções de edição, como remoção de objetos.

  • Muitas novidades sobre agentes:
    Agent Development Kit: facilita a criação de agentes por devs.
    Agent Space: diretório de agentes criados sem código.
    A2A: um protocolo de comunicação para a colaboração entre agentes.

  • Uso de agentes de AI embarcado no Google Cloud, como BigQuery e produtos de segurança da Cloud.

LLAMA 4: META LANÇA NOVO MODELO MAIS POTENTE
A Meta lançou seu novo modelo, o Llama 4 em 3 versões diferentes: Behemoth, Maverick e Scout. Os modelos utilizam uma arquitetura de Mixture of Experts (MoE) que permitem um uso mais eficiente do hardware no momento de inferência (geração da resposta).

  • A versão Scout (de 17 bilhões de parâmetros), permite uma janela de contexto de 10 milhões de tokens (aproximadamente 80 livros inteiros).

Porém, o modelo anunciado não foi o mesmo que foi disponibilizado para o público. Isso rendeu várias críticas, pois o novo modelo real teve um desempenho muito abaixo do que foi divulgado, ficando abaixo da 30ª posição no ranking da LM Arena.

ASSISTENTES DE IA NOS SMARTPHONES
As empresas de IA têm liberado diversas funcionalidades para tornar seus aplicativos mais próximos de assistente de IA nativos do smartphone:

CHATGPT BAJULADOR
Uma atualização recente do modelo GPT-4o inseriu um comportamento no ChatGPT para agradar o usuário de forma exagerada. A alteração tinha como intenção aumentar a quantidade de feedbacks positivos recebida pelo modelo, mas acabou tomando proporções maiores do que o esperado. Para contornar esse problema a OpenAI desfez o update de versão do modelo e está avaliando internamente formas de evitar o comportamento “bajulador”.

OPENAI DESISTE DE SE TORNAR UMA EMPRESA COM FINS LUCRATIVOS
A OpenAI está revendo seus planos de se tornar uma empresa totalmente com fins lucrativos e, em vez disso, transformará sua unidade com fins lucrativos em uma Corporação de Benefício Público (PBC), mantendo o controle sob sua holding sem fins lucrativos.

  • Essa decisão permite a captação de recursos no mercado de capitais, de forma similar a outros laboratórios de inteligência artificial como Anthropic e xAI. A mudança ocorre após uma grande pressão e lobby dos outros grandes players do mercado de IA (xAI, Meta e Anthropic), o que levou ao board decidir por outro caminho.

OPENAI EM PROCESSO DE COMPRA DO WINDSURF
A OpenAI fechou acordo para adquirir a Windsurf (ex-Codeium), ferramenta de codificação assistida por IA, por cerca de US$ 3 bilhões — sua maior aquisição até hoje. O negócio ainda não foi concluído oficialmente. A aquisição deve impulsionar significativamente a funcionalidade de codificação do ChatGPT, e posicionar a OpenAI para competir no mercado de Agentes de Codificação por IA.

O QUE MAIS ACONTECEU?

OPEN AI DEEP RESEARCH LIGHT
OpenAI lança versão light do DeepResearch, inclusive disponível para o plano free usando o4-mini (a versão normal usa o o3).

ALUCINAÇÕES DE NOVOS MODELOS DA OPENAI
Pesquisas internas chegaram a conclusão que os modelos o3 e o4-mini alucinam consideravelmente mais do que os modelos anteriores (o1, o1-mini e o3-mini).

MICROSOFT LANÇA O AGENT BUILDER PARA OFFICE 365
O lançamento permite que agentes sejam construídos para automatizar tarefas em todo o workspace do Office 365.

NOVO MODELO CHINÊS
A gigante chinesa Alibaba lançou a família de modelos Qwen 3. As grandes atrações da família de modelos são os modelos Qwen3-235B-A22B e Qwen3-30B-A3B que usam a arquitetura de Mixture of Experts. Isso permite que o modelo tenha uma grande quantidade de informação aprendida, mas utilizem muito menos recursos computacionais no momento de geração da resposta.

NOVO MODELO TEXT-TO-SPEECH OPEN SOURCE
Dia é um modelo de text-to-speech (texto para fala) muito pequeno, que foi construído por dois estudantes de graduação. O modelo tem desempenho superior aos atuais de estado da arte, como os modelos da Eleven Labs.

ANTHROPIC ECONOMIC INDEX
Edição do índice econômico mostra os avanços da AI no desenvolvimento de software, comparando os usos do Claude IA e do Claude Code (agente de desenvolvimento de software).

IA NO SISTEMA JURÍDICO DOS EMIRADOS ARÁBES
O governo dos Emirados árabes está planejando integrar IA ao sistema legislativo e regulatório, inclusive para a criação de regulamentações.

DUOLINGO AI-FIRST
O CEO (Luis von Ahn) anunciou em um email que a empresa adotará uma estratégia AI-first, visando aumentar o uso de tecnologias de IA para remover gargalos e aumentar a produtividade. Recentemente, a empresa substituiu um processo manual e lento de criação de conteúdo por um movido por IA, o que ajudou o Duolingo a expandir rapidamente suas ofertas.

*Curadoria de notícias da sessão e comentários feitos por Rafael Girolineto, AI expert, parceiro da Snaq e Data & AI Manager da Inspira

INFOGRÁFICO DA EDIÇÃO

O gráfico de hoje mostra o desempenho dos melhores modelos de IA entre 2012 e 2024 em benchmarks técnicos padronizados, comparado à média humana. Em 2024, a IA já aparece superando os humanos na maioria das tarefas avaliadas por esses benchmarks — incluindo leitura, compreensão de linguagem e classificação de imagens. Até mesmo benchmarks mais exigentes, como matemática competitiva (MATH) e raciocínio multimodal (MMMU), apresentaram avanços significativos. Quer saber mais? Leia aqui no AI Index Report 2025, página 93.

Aqui na Snaq, acreditamos que as melhores marcas são aquelas que compartilham conhecimento e se tornam thought leaders para a sociedade!

Quer ser nosso parceiro nessa missão de compartilhar inteligência e educação sobre inovação? Manda uma mensagem pra gente!

O que achou dessa edição?

Faça Login ou Inscrever-se para participar de pesquisas.