TQyFvneKnu4v4s3PyQboxqQByEYCteB7se
#Nieuws ·2024-04-30 09:49:29
In het overzicht van deze maand lichten we het belangrijkste AI-nieuws van april uit:
Adobe koopt video voor zijn AI
Adobe koopt actief videomateriaal om zijn AI-tekst-naar-videogenerator te ontwikkelen. Het bedrijf moedigt zijn netwerk van fotografen en kunstenaars aan om video's in te sturen die alledaagse handelingen en emoties weergeven, met een gemiddelde uitbetaling van $ 2,62 per minuut video. Daarnaast onderzoekt Adobe samenwerkingen met externe AI-leveranciers zoals Runway, Pika Labs en het Sora-model van OpenAI.
De achtergrond: De groeiende interesse van het bedrijf in het kopen van video's van fotografen en kunstenaars weerspiegelt een recente trend waarbij bedrijven vertrouwen op gelicentieerde content om AI-modellen te trainen. Door de juiste licenties te verkrijgen, kunnen bedrijven juridische risico's verminderen en tegelijkertijd hoogwaardige datasets verkrijgen voor het trainen van modellen.
Daarnaast zal Adobe ook AI-videotools introduceren in zijn Premiere Pro-bewerkingsplatform en is het van plan zijn eigen generatieve AI-videomodellen te integreren in de Firefly-serie. Deze tools bieden onder andere de mogelijkheid om videocontent te genereren en te verwerken met behulp van tekstprompts, met als doel de bewerkingservaring van de gebruiker te verbeteren.
Trainingsgegevens van Adobe Firefly roepen ethische vragen op
Adobes software voor het genereren van afbeeldingen Firefly, die geprezen wordt om zijn ethische trainingsgegevens, heeft tot controverse geleid nadat bleek dat de software getraind was met afbeeldingen van bronnen zoals Midjourney.
Hoewel Adobe aanvankelijk beweerde dat Firefly voornamelijk vertrouwde op gelicentieerde afbeeldingen van Adobe Stock, lijkt het erop dat door AI gegenereerde content (inclusief die van concurrenten) ook heeft bijgedragen aan de training van Firefly. Adobe Stock is een van de weinige stockfotoplatforms die content accepteert die is gegenereerd door diensten van derden. Omdat Adobe zijn content gebruikt om zijn algoritmen te trainen, heeft de opname van door derden gegenereerde content in Adobe Stock onbedoeld bijgedragen aan de trainingsgegevens van tools zoals Firefly. Ondanks de onthullingen beweert Adobe nog steeds de kwaliteit van zijn datasets te controleren:
"Elke afbeelding die bij Adobe Stock wordt ingediend, inclusief een kleine subset van afbeeldingen die met AI zijn gegenereerd, ondergaat een streng beoordelingsproces om te garanderen dat deze geen intellectueel eigendom, handelsmerken, herkenbare personages of logo's of verwijzingen naar kunstenaars bevat."
Adobe-woordvoerder
Tussen de regels door: Deze ontdekking zet de beweringen van Firefly dat ze een "bedrijfsveilig" alternatief zijn, op losse schroeven en roept vragen op over transparantie en ethische normen bij de ontwikkeling van AI-modellen.
De wereldwijde uitrol van Meta AI
Met behulp van Meta Llama 3 breidt Meta AI zijn wereldwijde bereik uit met nieuwe functies die zijn ontworpen om dagelijkse taken eenvoudiger en aangenamer te maken.
Meta AI is nu live op Facebook, Instagram, WhatsApp en Messenger en beschikbaar in meer dan twaalf landen, waaronder Australië, Canada en Nigeria. Gebruikers kunnen nu op Meta AI vertrouwen om diverse taken uit te voeren, van het aanbevelen van restaurants op basis van specifieke voorkeuren tot het uitleggen van complexe concepten zoals genetische eigenschappen.
Bovendien is Meta AI geïntegreerd in het Meta-ecosysteem, inclusief zoekfunctionaliteit en mogelijkheden voor het genereren van afbeeldingen, wat de gebruikerservaring op alle platforms verbetert. Met de Imagine-functie kunnen gebruikers in realtime afbeeldingen genereren uit tekst, met een scherpere beeldkwaliteit en ondersteuning voor het toevoegen van tekst aan afbeeldingen.
Achtergrond: Nu de AI-race voortduurt, intensiveert Meta duidelijk zijn inspanningen om de voorsprong op zijn concurrenten te verkleinen en een leider te worden op het gebied van kunstmatige intelligentie.
Snap voorziet AI-gegenereerde afbeeldingen van een watermerk
Snap kondigde plannen aan om AI-gegenereerde afbeeldingen op zijn platform te voorzien van een semi-transparant Snap-logo en een glanzende emoji. Deze stap is bedoeld om afbeeldingen die zijn gemaakt met Snap AI-tools te markeren en zo de transparantie en veiligheid voor gebruikers te vergroten.
Het bedrijf verduidelijkte dat het verwijderen van deze watermerken in strijd zou zijn met de gebruiksvoorwaarden, maar de methode om dergelijke verwijderingen te detecteren is nog niet openbaar gemaakt. Daarnaast heeft Snap AI-functie-indicatoren en contextkaarten geïntroduceerd voor AI-gegenereerde afbeeldingen om gebruikers meer informatie te bieden. Tussen de regels door: de beslissing van Snap is in lijn met vergelijkbare initiatieven van techgiganten zoals OpenAI en Meta om door AI gegenereerde content te markeren, en sluit ook aan bij de groeiende trend van transparantie en de herkomst van content.
Coca-Cola x Microsoft
The Coca-Cola Company en Microsoft zijn een vijfjarig strategisch partnerschap aangegaan om cloud- en GenAI-initiatieven te versnellen. Coca-Cola heeft $ 1,1 miljard toegezegd aan de cloud- en GenAI-mogelijkheden van Microsoft, wat een belangrijke stap is in de voortdurende technologische transformatie. Met Microsoft Azure en AI wil Coca-Cola elke bedrijfsfunctie revolutioneren, van marketing tot productie en supply chain management. Door alle applicaties naar Microsoft Azure te verplaatsen en AI-gestuurde digitale assistenten te verkennen, zet Coca-Cola zich in om de klantervaring te verbeteren, de bedrijfsvoering te stroomlijnen, innovatie te bevorderen en nieuwe groeimogelijkheden te ontdekken.
Achtergrond: Coca-Cola is een voorbeeld van hoe niet-technologische merken kunstmatige intelligentie kunnen gebruiken om een concurrentievoordeel te behalen. Met behulp van AI heeft Coca-Cola het supply chain management verbeterd, distributieprocessen gestroomlijnd en de klantervaring verbeterd. Daarnaast is Coca-Cola onlangs een samenwerking aangegaan met OpenAI om de campagne "Masterpiece" te lanceren, die de innovatieve marketingaanpak van het merk onder de aandacht brengt.
AI in de gezondheidszorg
Profluent Bio heeft de kracht van GenAI gebruikt om een baanbrekende gen-editor te ontwikkelen, genaamd OpenCRISPR-1. Het bedrijf gebruikte zijn eigen grootschalige taalmodel voor eiwitontwerp, ProGen2, om te trainen op een enorme database van Cas9-eiwitten voor genbewerking. Deze innovatieve aanpak resulteerde uiteindelijk in nieuwe eiwitten voor genbewerking die menselijke cellen kunnen modificeren. Het team gebruikte ook een ander AI-systeem om de gids-RNA te genereren die nodig is voor nauwkeurige targeting. Hoewel de ontwerpsoftware bedrijfseigen blijft, heeft Profluent besloten OpenCRISPR-1 open te stellen voor onderzoekers, wat een belangrijke stap voorwaarts betekent op het gebied van genbewerking.
Moderna, een farmaceutisch en biotechnologisch bedrijf gevestigd in Cambridge, is een samenwerking aangegaan met OpenAI om ChatGPT Enterprise te integreren in al zijn activiteiten. Moderna streeft naar brede acceptatie en heeft een ambitieus programma gelanceerd om ervoor te zorgen dat alle medewerkers bedreven zijn in de GenAI-technologie. Door een cultuur van collectieve intelligentie te bevorderen en te investeren in een uitgebreid programma voor verandermanagement, heeft Moderna indrukwekkende resultaten behaald. Zo heeft meer dan 80% van de medewerkers met succes een AI-chatbottool geïmplementeerd die is gebaseerd op de OpenAI API mChat. Daarnaast is Moderna een pionier in het gebruik van AI-technologie bij de ontwikkeling van klinische studies en heeft het innovatieve oplossingen gelanceerd zoals Dose ID, dat data-analyse vereenvoudigt en besluitvormingsprocessen verbetert.
Waarom het belangrijk is: Deze voorbeelden illustreren hoe AI bijdraagt aan een positieve verandering van de wereld, met name de gezondheidszorg.
AI Filmconferentie
AI on the Lot bereidt zich voor op een AI Filmconferentie op 16 mei 2024 in LA Center Studios. Deze conferentie zal meer dan 500 AI-liefhebbers, filmmakers en professionals aantrekken. Het evenement omvat filmvertoningen, diepgaande paneldiscussies met leiders uit de industrie, praktische workshops en live demonstraties die de kruising van AI en filmmaken verkennen.
De AI on the Lot-conferentie van 2024 zal een aantal vooraanstaande sprekers verwelkomen, waaronder Katja Reitemeyer, directeur data science en AI bij NVIDIA; Kathryn Brillhart, supervisor virtuele productie voor films zoals Fallout en Rebel Moon; en Chad Nelson, creatief expert bij OpenAI. De conferentie zal zich richten op hoe de convergentie van technologie en creativiteit de toekomst van entertainment zal vormgeven.
Alexander Shironosov, hoofd van het R&D-team bij Everypixel, duikt in de nieuwste versies van de AI-modellen:
LLM:
Mistral – Mixture of Experts Mixtral-8x22B: Een nieuw groot model dat gebruikmaakt van een mix van expertsarchitectuur om de prestaties en efficiëntie te verbeteren.
Lancering van Meta's llama3: Meta lanceerde twee versies van het llama3-model, met 8B- en 70B-parameters. De 8B-versie presteert vergelijkbaar met het grotere llama2 70B-model. Microsofts Phi 3: Na de succesvolle implementatie van phi1 en phi2 in kleine VLM's lanceerde Microsoft phi3. Vroege statistieken gebaseerd op phi3-training, gepresenteerd door ShareGPT4v, geven aan dat phi3 beter presteert dan zwaardere modellen, wat wijst op een breed potentieel voor implementatie in vergelijkbare toepassingen.
Apples OpenELM-initiatief: Apple heeft een reeks kleine open-source AI-modellen gelanceerd, genaamd OpenELM, ontworpen voor on-device toepassingen. De modellen variëren in grootte - 270 miljoen, 450 miljoen, 1,1 miljard en 3 miljard parameters.
Fineweb-release: FineWeb-dataset, een verzameling tekstdatasets van het web (CommonCrawl), vrijgegeven onder een licentie (ODC-By).
Dolma-update: Dolma, een gelabelde dataset van 3 biljoen met webcontent, academische publicaties, code, boeken en encyclopedisch materiaal, heeft een bijgewerkte versie uitgebracht. Snowflake's Arctic basismodel: Snowflake heeft Snowflake Arctic uitgebracht en een gedetailleerde verkenning van het model gepubliceerd. Het model maakt gebruik van een mixed-expert architectuur die de mogelijkheden voor diverse AI-taken vergroot.
Innovatie van startup Answer.AI: Answer.AI heeft een artikel gepubliceerd en code vrijgegeven voor hun FSD/DORA-aanpak, waarmee grootschalige llama3 kan worden getraind op slechts twee videokaarten met elk 24 GB videogeheugen. Dit demonstreert een efficiënte manier om resource-intensieve AI-training te beheren.
Volumetric Flow Meter (VLM):
InternVL 1.5: Dit open-sourcemodel heeft een krachtige visuele encoder en is getraind op hoogwaardige datasets voor afbeeldingen van verschillende formaten, van 448×448 tot 4kx4k. In sommige opzichten presteert InternVL 1.5 beter dan commerciële topmodellen zoals de GPT-4v, Claude Opus en Gemini 1.5 Pro.
Nieuwe benchmark voor het testen van visuele taalmodellen (VLM): Er is een nieuwe versie van de benchmark uitgebracht, ontworpen voor het testen van visuele taalmodellen op afbeeldingen met veel tekst. Deze benchmark is bedoeld om de prestaties van VLM bij het verwerken van complexe visueel-tekstuele interacties nauwkeuriger te evalueren, wat cruciaal is voor het verbeteren van de toepassingen in de praktijk.
Videogeneratie:
Microsofts Talking Head-model: Microsoft heeft een nieuw model geïntroduceerd dat "talking face"-video's genereert op basis van audio-invoer en foto's. Het model maakt gebruik van een diffusiemodel en presteert aanzienlijk beter dan eerdere methoden op alle belangrijke prestatiemetingen. Deze release heeft de potentie om een revolutie teweeg te brengen in de manier waarop dynamische videocontent wordt gecreëerd op basis van statische afbeeldingen en geluiden.
Afbeeldinggeneratie:
Imgsys Tekst-naar-afbeeldingmodel: Er is een nieuw platform gelanceerd, Imgsys genaamd, om paarsgewijze vergelijkingen te vergemakkelijken en Elo-beoordelingen te ontwikkelen voor verschillende tekst-naar-afbeeldingmodellen. Dit omvat controlepunten voor modellen zoals SDXL, evenals stand-alone modellen vergelijkbaar met Pixart-Sigma. Verbeteringen van het diffusiemodel van NVIDIA: NVIDIA heeft twee artikelen gepubliceerd waarin methoden worden beschreven voor het verbeteren van de beeldkwaliteit met behulp van diffusiemodellen zonder directe modelhertraining. De eerste methode maakt gebruik van classifier-vrije planning om de beeldscherpte te verbeteren, terwijl de tweede methode de ruisverwijderingsstap optimaliseert om de uitvoer verder te optimaliseren.
Verbeterde IP-adapter voor portretgeneratie: We hebben een verbeterde IP-adapter ontwikkeld voor het genereren van nauwkeurige en gedetailleerde portretten van foto's. De tool maakt gebruik van geavanceerde beeldverwerkingstechnieken om het realisme en de kwaliteit van gegenereerde portretten te verbeteren.
Versnelling van het diffusiemodel van Meta: Meta heeft een artikel gepubliceerd waarin hun nieuwe methode, "Imagine Flash", wordt beschreven om diffusiemodellen te versnellen met behulp van een techniek genaamd "reverse distillation". Deze methode versnelt de verwerkingstijd van diffusiemodellen aanzienlijk, terwijl de kwaliteit van gegenereerde afbeeldingen behouden blijft of zelfs verbetert.
Adobe Firefly v3 voor Photoshop: Adobe heeft Firefly v3 geïntroduceerd, een nieuwe versie van de integratie in Photoshop. Met de tool kunnen gebruikers specifieke objecten degraderen, achtergronden wijzigen en nieuwe afbeeldingen vanaf nul genereren.