Principais avanços na inteligência artificial em janeiro de 2025
#Notícias ·2025-01-30 09:10:47
O ano de 2025 começa com uma enxurrada de desenvolvimentos entusiasmantes em IA, especialmente em agentes autónomos, assistentes de programação e modelos de linguagem de última geração. Desde o novo agente da OpenAI, que pode navegar na web, até aos avanços na colaboração multiagente, eis alguns resultados notáveis e a sua importância.
1. Operator da OpenAI: Um agente de IA que interage com um browser
O que é?
Operator é um agente de IA desenvolvido pela OpenAI, atualmente em fase de pré-visualização de pesquisa, que pode navegar e interagir com sites em nome dos utilizadores. Baseia-se num novo modelo chamado CUA (Computer Usage Agent) que emula operações de rato e teclado sem a necessidade de APIs personalizadas.
Por que razão é importante
Tarefas repetitivas: O Operator simplifica o preenchimento de formulários, encomendas de supermercado e muito mais.
Fluxos de trabalho paralelos: Pode executar várias tarefas em simultâneo - semelhante a várias abas do navegador.
Implementação: Atualmente disponível para utilizadores do ChatGPT Pro nos EUA; a OpenAI pretende integrá-lo totalmente no ChatGPT no futuro.
Segurança e privacidade: Características como o modo de aquisição e o modo de monitorização garantem o controlo do utilizador e a proteção dos dados.
2. SwiftKV: Um avanço para a inferência de LLM mais rápida e barata na Snowflake
O que é
O SwiftKV é uma tecnologia de otimização desenvolvida pela Snowflake AI Research (integrada no vLLM) para reduzir a sobrecarga computacional de grandes modelos de linguagem, especialmente a variante Llama da Snowflake.
Principais inovações
Reutilização da cache KV: Reutilizar estados ocultos para reduzir cálculos repetidos.
Ajuste fino leve: Aumente a velocidade, mantendo a precisão próxima da original.
Melhoria de desempenho: Reduza a computação de pré-população até 50%, duplique a taxa de transferência em GPUs de ponta e reduza a latência até 50%.
Impacto empresarial
O SwiftKV reduz os custos de inferência no Snowflake Cortex AI em 75%, abrindo caminho para implementações de LLM mais escaláveis e económicas – particularmente útil para chatbots, análises em tempo real e processamento de texto de grande volume.
3. AgentWorkflow no LlamaIndex: Simplificando Sistemas Multi-Agente
O que é
O AgentWorkflow é um sistema baseado na abstração de workflow do LlamaIndex, facilitando a criação e gestão de agentes de IA com estado e em várias etapas.
Por que razão é importante
Tipos de agentes flexíveis: FunctionAgent, ReActAgent ou soluções personalizadas.
Visibilidade em tempo real: Os fluxos de eventos e a gestão de estado integrada proporcionam uma visibilidade clara das tarefas de cada agente.
Interação homem-máquina: Os programadores podem introduzir pontos de revisão ou recolher feedback do utilizador antes de prosseguir.
Benefícios do desenvolvimento
Ao eliminar grande parte do código cliché para coordenação e partilha de dados, o AgentWorkflow ajuda as equipas a concentrarem-se na lógica das interações dos agentes, em vez das ligações complexas por trás delas.
4. NVIDIA DRIVE Hyperion: Segurança Certificada para Condução Autónoma
O que é
O NVIDIA DRIVE Hyperion é uma plataforma completa para veículos autónomos (AV), incluindo SoC, software e conjunto de sensores, recentemente testada e aprovada por importantes agências de segurança, como a TÜV SÜD e a TÜV Rheinland.
Atualizações Importantes
DRIVE Thor: A próxima versão apresenta um SoC de última geração baseado na arquitetura NVIDIA Blackwell.
Certificações de Segurança: As certificações ISO 21434 e ASIL-D destacam a sua maturidade em matéria de cibersegurança e segurança funcional.
Abordagem de três computadores: Combinando computação embarcada (DRIVE AGX), treino em cloud (NVIDIA DGX) e simulação (NVIDIA OVX + Omniverse).
Por que razão é importante
A certificação da NVIDIA coloca o DRIVE Hyperion na vanguarda das soluções de condução autónoma seguras e escaláveis, abrindo caminho para automóveis sofisticados movidos por IA num futuro próximo.
5. Microsoft AutoGen v0.4: Grandes melhorias para a IA com Agentes
O que é
A versão mais recente (v0.4) do AutoGen apresenta uma arquitetura assíncrona e orientada a eventos, tornando-a mais robusta e escalável para sistemas baseados em agentes.
Melhorias Principais
Mensagens assíncronas: Simplifica a comunicação entre agentes.
Modular e extensível: Os componentes conectáveis permitem aos programadores adicionar ferramentas personalizadas, módulos de memória e muito mais.
Depuração melhorada: as métricas, o rastreio e o suporte OpenTelemetry melhoram a observabilidade.
Impacto
As equipas podem agora construir e distribuir redes complexas de agentes com menos esforço e menos restrições, impulsionando os avanços na investigação e aplicações empresariais que exigem colaboração entre múltiplos agentes.
6. Colaboração entre múltiplos agentes no Amazon Bedrock
O que é
O Amazon Bedrock suporta agora a estrutura de Colaboração entre Múltiplos Agentes (MAC), que coordena agentes de IA especializados para resolver tarefas complexas em áreas como o planeamento de viagens, o financiamento imobiliário e o desenvolvimento de software.
Benefícios significativos
Resolução distribuída de problemas: Decompõe as tarefas em subtarefas geridas por agentes especialistas.
Maior precisão: Supera os sistemas de agente único, que têm frequentemente alucinações ou fazem um mau uso de ferramentas quando enfrentam uma variedade de desafios.
Por que razão é importante
Esta abordagem demonstra que múltiplos agentes coordenados, cada um com expertise específica num domínio, fornecem resultados mais fiáveis e escaláveis do que um único LLM monolítico.
7. Vertex AI RAG Engine: A potência da IA da Google
O que é
A Google Cloud lançou o Vertex AI RAG (Retrieval Augmented Generation), que permite aos programadores ancorar a saída de IA a fontes externas, aliviando ilusões e fornecendo informações atualizadas.