Belangrijke ontwikkelingen in kunstmatige intelligentie in januari 2025
#Nieuws ·2025-01-30 09:10:47
Het jaar 2025 begint met een stortvloed aan spannende ontwikkelingen in AI, met name op het gebied van autonome agents, programmeerassistenten en taalmodellen van de volgende generatie. Van OpenAI's nieuwe agent die op het web kan surfen tot doorbraken in samenwerking tussen meerdere agents, hier zijn enkele opvallende resultaten en hun betekenis.
1. OpenAI's Operator: een AI-agent die communiceert met een browser
Wat is het?
Operator is een AI-agent ontwikkeld door OpenAI, momenteel in de onderzoeksfase, die namens gebruikers kan navigeren en communiceren met websites. Het is gebaseerd op een nieuw model genaamd CUA (Computer Usage Agent) dat muis- en toetsenbordbewerkingen emuleert zonder dat er aangepaste API's nodig zijn.
Waarom het belangrijk is
Repetitieve taken: Operator vereenvoudigt het invullen van formulieren, het bestellen van boodschappen en meer.
Parallelle workflows: Het kan meerdere taken tegelijkertijd uitvoeren - vergelijkbaar met meerdere browsertabbladen.
Uitrol: Momenteel beschikbaar voor ChatGPT Pro-gebruikers in de VS; OpenAI is van plan het in de toekomst volledig in ChatGPT te integreren. Beveiliging en privacy: Functies zoals de overnamemodus en de monitoringmodus zorgen voor gebruikerscontrole en gegevensbescherming.
2. SwiftKV: Een doorbraak voor snellere en goedkopere LLM-inferentie bij Snowflake
Wat het is
SwiftKV is een optimalisatietechnologie ontwikkeld door Snowflake AI Research (geïntegreerd in vLLM) om de rekenkracht van grote taalmodellen te verminderen, met name de Llama-variant van Snowflake.
Belangrijkste innovaties
KV-cachehergebruik: Hergebruik verborgen statussen om herhaalde berekeningen te verminderen.
Lichtgewicht finetuning: Verbeter de snelheid met behoud van bijna originele nauwkeurigheid.
Prestatieverbetering: Verminder pre-populatieberekeningen met tot 50%, verdubbel de doorvoer op high-end GPU's en verlaag de latentie met tot 50%.
Impact op bedrijven
SwiftKV verlaagt de inferentiekosten voor Snowflake Cortex AI met 75%, wat de deur opent naar schaalbare en kosteneffectieve LLM-implementaties - met name handig voor chatbots, realtime analyses en tekstverwerking met een hoog volume.
3. AgentWorkflow in LlamaIndex: Multi-Agent Systemen Vereenvoudigen
Wat het is
AgentWorkflow is een systeem dat bovenop de workflowabstractie van LlamaIndex draait, waardoor het eenvoudiger wordt om stateful, multi-step AI-agents te bouwen en beheren.
Waarom het belangrijk is
Flexibele agenttypen: FunctionAgent, ReActAgent of maatwerkoplossingen.
Realtime zichtbaarheid: Eventstreams en ingebouwd statusbeheer bieden duidelijk inzicht in de taken van elke agent.
Mens-machine-interactie: Ontwikkelaars kunnen beoordelingspunten invoegen of feedback van gebruikers verzamelen voordat ze verdergaan.
Ontwikkelingsvoordelen
Door veel standaardcode voor coördinatie en gegevensuitwisseling te elimineren, helpt AgentWorkflow teams zich te concentreren op de logica van agentinteracties in plaats van op de complexe verbanden erachter. 4. NVIDIA DRIVE Hyperion: Gecertificeerde veiligheid voor autonoom rijden
Wat het is
NVIDIA DRIVE Hyperion is een alles-in-één platform voor autonome voertuigen (AV), inclusief SoC, software en sensorsuite, dat onlangs is getest en goedgekeurd door belangrijke veiligheidsinstanties zoals TÜV SÜD en TÜV Rheinland.
Belangrijke updates
DRIVE Thor: De aankomende versie beschikt over een volgende generatie SoC gebaseerd op de NVIDIA Blackwell-architectuur.
Veiligheidscertificeringen: ISO 21434- en ASIL-D-certificeringen benadrukken de volwassenheid op het gebied van cybersecurity en functionele veiligheid.
Drie-computerbenadering: combinatie van onboard computing (DRIVE AGX), cloudtraining (NVIDIA DGX) en simulatie (NVIDIA OVX + Omniverse).
Waarom het belangrijk is
De certificering van NVIDIA plaatst DRIVE Hyperion in de voorhoede van veilige en schaalbare oplossingen voor autonoom rijden, wat de weg vrijmaakt voor geavanceerde AI-gestuurde auto's in de nabije toekomst.
5. Microsoft AutoGen v0.4: Grote verbeteringen voor Agentic AI
Wat het is
De nieuwste versie (v0.4) van AutoGen introduceert een asynchrone, gebeurtenisgestuurde architectuur, waardoor deze robuuster en schaalbaarder is voor agentgebaseerde systemen.
Belangrijkste verbeteringen
Asynchrone berichtenuitwisseling: Vereenvoudigt de communicatie tussen agenten.
Modulair en uitbreidbaar: Pluggable componenten laten ontwikkelaars aangepaste tools, geheugenmodules en meer toevoegen.
Verbeterde foutopsporing: Metrics, tracering en OpenTelemetry-ondersteuning verbeteren de observatiemogelijkheden.
Impact
Teams kunnen nu complexe agentnetwerken bouwen en distribueren met minder moeite en minder beperkingen, wat leidt tot vooruitgang in onderzoek en bedrijfstoepassingen die samenwerking tussen meerdere agenten vereisen.
6. Multi-Agent Collaboration op Amazon Bedrock
Wat het is
Amazon Bedrock ondersteunt nu het Multi-Agent Collaboration (MAC)-framework, dat gespecialiseerde AI-agenten coördineert om complexe taken uit te voeren op gebieden zoals reisplanning, hypotheekfinanciering en softwareontwikkeling. Belangrijke voordelen
Gedistribueerde probleemoplossing: Splitst taken op in subtaken die worden afgehandeld door deskundige agents.
Hogere nauwkeurigheid: Presteert beter dan systemen met één agent, die vaak hallucineren of tools verkeerd gebruiken wanneer ze met diverse uitdagingen worden geconfronteerd.
Waarom dit belangrijk is
Deze aanpak toont aan dat meerdere gecoördineerde agents, elk met domeinspecifieke expertise, betrouwbaardere en schaalbare resultaten opleveren dan één monolithische LLM.
7. Vertex AI RAG Engine: Google's Grounded AI Powerhouse
Wat het is
Google Cloud heeft de Vertex AI RAG (Retrieval Augmented Generation) engine gelanceerd, waarmee ontwikkelaars AI-output kunnen koppelen aan externe bronnen, illusies kunnen wegnemen en actuele informatie kunnen bieden.