Principais notícias sobre IA em abril de 2024
#Notícias ·2024-04-30 09:49:29
No resumo deste mês, destacamos as principais notícias sobre IA de abril:
A Adobe compra vídeos para a sua IA
A Adobe está a comprar ativamente vídeos para desenvolver o seu gerador de texto para vídeo com IA. A empresa está a incentivar a sua rede de fotógrafos e artistas a enviar vídeos que retratam ações e emoções quotidianas, com um pagamento médio de 2,62 dólares por minuto de vídeo. Além disso, a Adobe está a explorar parcerias com fornecedores de IA de terceiros, como a Runway, a Pika Labs e o modelo Sora da OpenAI.
Contexto: O crescente interesse da empresa em comprar vídeos de fotógrafos e artistas reflete uma tendência recente de empresas que dependem de conteúdo licenciado para treinar modelos de IA. Ao obter as licenças adequadas, as empresas podem reduzir os riscos legais e, ao mesmo tempo, obter conjuntos de dados de alta qualidade para a formação de modelos.
Além disso, a Adobe também introduzirá ferramentas de vídeo com IA na sua plataforma de edição Premiere Pro e planeia integrar os seus próprios modelos de vídeo com IA generativa na série Firefly. Estas ferramentas incluem a capacidade de gerar e processar conteúdo de vídeo utilizando prompts de texto, visando melhorar a experiência de edição do utilizador.
Os dados de formação do Adobe Firefly levantam questões éticas
O software de geração de imagens Firefly, da Adobe, elogiado pelas suas práticas éticas de dados de treino, gerou controvérsia após a revelação de que foi treinado utilizando imagens de fontes como a Midjourney.
Embora a Adobe tenha alegado inicialmente que o Firefly se baseava principalmente em imagens licenciadas do Adobe Stock, parece que o conteúdo gerado por IA (incluindo dos seus concorrentes) também contribuiu para a formação do Firefly. O Adobe Stock é uma das poucas plataformas de bancos de imagens que aceita conteúdos gerados por serviços de terceiros. Portanto, uma vez que a Adobe utiliza o seu conteúdo para treinar os seus algoritmos, a inclusão de conteúdo gerado por terceiros no Adobe Stock contribuiu inadvertidamente para os dados de treino de ferramentas como o Firefly.
No entanto, apesar das revelações, a Adobe ainda afirma que controla a qualidade dos seus conjuntos de dados:
“Todas as imagens enviadas para o Adobe Stock, incluindo um pequeno subconjunto de imagens geradas com IA, passam por um rigoroso processo de revisão para garantir que não contêm propriedade intelectual, marcas registadas, caracteres ou logótipos reconhecíveis ou referências a artistas.”
Porta-voz da Adobe
Nas entrelinhas: Esta descoberta desafia as afirmações da Firefly de ser uma alternativa “segura para o negócio” e levanta questões sobre a transparência e os padrões éticos no desenvolvimento de modelos de IA.
Lançamento global da Meta AI
Com a tecnologia Meta Llama 3, a Meta AI está a expandir o seu alcance global com novas funcionalidades concebidas para tornar as tarefas diárias mais fáceis e agradáveis.
A Meta AI já está disponível no Facebook, Instagram, WhatsApp e Messenger, e disponível em mais de uma dezena de países, incluindo Austrália, Canadá e Nigéria. Os utilizadores podem agora contar com a Meta AI para realizar uma variedade de tarefas, desde recomendar restaurantes com base em preferências específicas até explicar conceitos complexos como características genéticas.
Além disso, o Meta AI foi integrado no ecossistema Meta, incluindo funcionalidades de pesquisa e geração de imagens, melhorando a experiência do utilizador em todas as plataformas. Com a funcionalidade Imagine, os utilizadores podem gerar imagens a partir de texto em tempo real, com uma qualidade de imagem mais nítida e suporte para adicionar texto às imagens.
Contexto: À medida que a corrida da IA continua, o Meta está claramente a intensificar os seus esforços para diminuir a distância em relação aos seus concorrentes e tentar tornar-se líder no campo da inteligência artificial.
Snap marca de água em imagens geradas por IA
A Snap anunciou planos para marcar imagens geradas por IA na sua plataforma com um logótipo Snap semitransparente e um emoji brilhante como marcas de água. A mudança visa destacar imagens criadas com as ferramentas de IA da Snap, aumentando assim a transparência e a segurança para os utilizadores.
A empresa esclareceu que a remoção destas marcas de água violaria os seus termos de utilização, mas o método para detetar tais remoções ainda não foi divulgado. Além disso, a Snap introduziu indicadores de características de IA e cartões de contexto para imagens geradas por IA para fornecer mais informações aos utilizadores. Nas entrelinhas: A decisão da Snap é consistente com iniciativas semelhantes de gigantes tecnológicos, como a OpenAI e a Meta, para marcar o conteúdo gerado por IA e está também em linha com a crescente tendência de transparência e proveniência do conteúdo.
Coca-Cola vs Microsoft
A Coca-Cola Company e a Microsoft estabeleceram uma parceria estratégica de cinco anos para acelerar as iniciativas de cloud e GenAI. A Coca-Cola investiu 1,1 mil milhões de dólares nos recursos de cloud e GenAI da Microsoft, marcando um passo importante na sua contínua transformação tecnológica. Com o Microsoft Azure e a IA, a Coca-Cola pretende revolucionar todas as funções de negócio, desde o marketing ao fabrico e à gestão da cadeia de abastecimento. Ao migrar todas as aplicações para o Microsoft Azure e explorar assistentes digitais baseados em IA, a Coca-Cola está empenhada em melhorar a experiência do cliente, otimizar as operações, promover a inovação e descobrir novas oportunidades de crescimento.
Contexto: A Coca-Cola é um exemplo de como as marcas não tecnológicas podem utilizar a inteligência artificial para obter vantagem competitiva. Utilizando a IA, a Coca-Cola melhorou a gestão da cadeia de abastecimento, simplificou os processos de distribuição e melhorou a experiência do cliente. Além disso, a Coca-Cola estabeleceu recentemente uma parceria com a OpenAI para lançar a campanha "Masterpiece", que destaca a abordagem inovadora de marketing da marca.
IA em Operações de Saúde
A Profluent Bio utilizou o poder da GenAI para desenvolver um editor de genes inovador, chamado OpenCRISPR-1. A empresa utilizou o seu modelo de linguagem proprietário em larga escala para o design de proteínas, o ProGen2, para treinar numa enorme base de dados de proteínas de edição genética Cas9. Esta abordagem inovadora acabou por criar novas proteínas de edição genética capazes de modificar células humanas. A equipa também empregou outro sistema de IA para gerar o RNA guia necessário para o direcionamento preciso. Embora o software de design continue a ser proprietário, a Profluent decidiu disponibilizar o OpenCRISPR-1 aos investigadores, marcando um grande avanço no campo da edição genética.
A Moderna, empresa farmacêutica e de biotecnologia sediada em Cambridge, estabeleceu uma parceria com a OpenAI para integrar o ChatGPT Enterprise em todas as suas operações. Empenhada na ampla adoção, a Moderna lançou um programa ambicioso para garantir que todos os colaboradores são proficientes na tecnologia GenAI. Ao promover uma cultura de inteligência coletiva e ao investir num programa abrangente de gestão da mudança, a Moderna alcançou resultados impressionantes, incluindo mais de 80% dos colaboradores a adotarem com sucesso uma ferramenta de chatbot de IA desenvolvida com base na API mChat da OpenAI. Além disso, a Moderna foi pioneira na utilização da tecnologia de IA no desenvolvimento de ensaios clínicos e lançou soluções inovadoras, como o Dose ID, que simplifica a análise de dados e melhora os processos de tomada de decisão.
Porque é importante: Estes exemplos demonstram como a IA está a ajudar a mudar o mundo, especialmente a área da saúde, para melhor.
Conferência de Cinema com IA
O AI on the Lot está a preparar-se para uma Conferência de Cinema com IA no dia 16 de maio de 2024, nos LA Center Studios, que atrairá mais de 500 entusiastas, cineastas e profissionais de IA. O evento contará com exibições de filmes, painéis de discussão aprofundados com líderes do setor, workshops práticos e demonstrações ao vivo que explorarão a interseção entre a IA e a produção cinematográfica.
A conferência AI on the Lot de 2024 contará com diversos oradores de alto nível, incluindo Katja Reitemeyer, diretora de ciência de dados e IA da NVIDIA; Kathryn Brillhart, supervisora de produção virtual de filmes como Fallout e Rebel Moon; e Chad Nelson, especialista criativo da OpenAI. A conferência irá focar-se na forma como a convergência entre tecnologia e criatividade irá moldar o futuro do entretenimento.
Alexander Shironosov, chefe da equipa de I&D da Everypixel, analisa as versões mais recentes dos modelos de IA:
LLM:
Mistral – Mixtral de Especialistas Mixtral-8x22B: Um novo modelo de grandes dimensões que utiliza uma arquitetura de mistura de especialistas para melhorar o desempenho e a eficiência.
Lançamento do llama3 da Meta: A Meta lançou duas versões do modelo llama3, com parâmetros 8B e 70B. A versão 8B tem um desempenho equivalente ao modelo maior llama2 70B.
LLM:
Mistral – Mixtral de Especialistas Mixtral-8x22B: Um novo modelo de grandes dimensões que utiliza uma arquitetura de mistura de especialistas para melhorar o desempenho e a eficiência.
Lançamento do llama3 da Meta: A Meta lançou duas versões do modelo llama3, com parâmetros 8B e 70B. A versão 8B tem um desempenho equivalente ao modelo llama2 70B, de maiores dimensões. Phi 3 da Microsoft: Após a implementação bem-sucedida do phi1 e do phi2 em VLMs pequenos, a Microsoft lançou o phi3. As métricas iniciais baseadas no treino do phi3 apresentado pelo ShareGPT4v indicam que o phi3 supera os modelos mais pesados, sugerindo um amplo potencial para adoção em aplicações semelhantes.
Iniciativa OpenELM da Apple: A Apple lançou uma série de pequenos modelos de IA de código aberto, denominados OpenELM, concebidos para aplicações em dispositivos. Os modelos variam em tamanho — 270 milhões, 450 milhões, 1,1 mil milhões e 3 mil milhões de parâmetros.
Lançamento do FineWeb: Conjunto de dados do FineWeb, uma coleção de conjuntos de dados de texto da web (CommonCrawl), lançado sob uma licença (ODC-By).
Atualização do Dolma: O Dolma, um conjunto de dados rotulados de 3 triliões de conteúdos web, publicações académicas, código, livros e material enciclopédico, lançou uma versão atualizada.
Modelo base Arctic da Snowflake: A Snowflake lançou o Snowflake Arctic e publicou uma exploração detalhada do seu modelo, que utiliza uma arquitetura de especialistas mistos que melhora a sua capacidade de lidar com uma variedade de tarefas de IA.
Inovação da startup Answer.AI: A Answer.AI publicou um artigo e libertou o código para a sua abordagem FSD/DORA, que permite o treino de llama3 em larga escala em apenas duas placas gráficas com 24 GB de memória de vídeo cada, demonstrando uma forma eficiente de gerir o treino de IA com utilização intensiva de recursos.
Medidor de Fluxo Volumétrico (VLM):
InternVL 1.5: Este modelo de código aberto possui um codificador visual poderoso e é treinado em conjuntos de dados de alta qualidade para imagens de vários tamanhos, desde 448×448 a 4kx4k. Em alguns aspetos, o InternVL 1.5 supera os principais modelos comerciais, como o GPT-4v, Claude Opus e Gemini 1.5 Pro.
Novo Benchmark para Testes de Modelos de Linguagem Visual (VLM): Foi lançada uma nova versão do benchmark desenvolvido para testar modelos de linguagem visual em imagens com muito texto. Este benchmark visa fornecer uma avaliação mais rigorosa do desempenho do VLM no tratamento de interações visuais-textuais complexas, o que é fundamental para a melhoria das suas aplicações no mundo real.
Geração de Vídeo:
Modelo de Cabeça Falante da Microsoft: A Microsoft introduziu um novo modelo que gera vídeos de "rostos falantes" a partir de entradas de áudio e fotografias. O modelo utiliza um modelo de difusão e supera significativamente os métodos anteriores em todas as principais métricas de desempenho. Esta versão tem o potencial de revolucionar a forma como o conteúdo de vídeo dinâmico é criado a partir de imagens e sons estáticos.
Geração de Imagens:
Modelo de Texto para Imagem Imgsys: Foi lançada uma nova plataforma chamada Imgsys para facilitar as comparações em pares e criar classificações Elo para vários modelos de texto para imagem. Isto inclui pontos de verificação para modelos como o SDXL, bem como modelos independentes comparáveis ao Pixart-Sigma.
Melhorias no Modelo de Difusão da NVIDIA: A NVIDIA publicou dois artigos detalhando métodos para melhorar a qualidade da geração de imagens utilizando modelos de difusão sem retreino direto do modelo. O primeiro método utiliza o agendamento sem classificador para melhorar a nitidez da imagem, enquanto o segundo método otimiza a etapa de redução de ruído para otimizar ainda mais a saída.
Adaptador IP de Geração de Retratos melhorado: Desenvolvemos um adaptador IP melhorado para gerar retratos precisos e detalhados a partir de fotografias. A ferramenta utiliza técnicas avançadas de processamento de imagem para melhorar o realismo e a qualidade dos retratos gerados.
Aceleração do Modelo de Difusão da Meta: A Meta publicou um artigo detalhando o seu novo método, "Imagine Flash", para acelerar os modelos de difusão através de uma técnica chamada "destilação inversa". Este método acelera significativamente o tempo de processamento dos modelos de difusão, mantendo ou mesmo melhorando a qualidade das imagens geradas.
Adobe Firefly v3 para Photoshop: A Adobe lançou o Firefly v3, uma nova versão da sua integração com o Photoshop. A ferramenta permite aos utilizadores degradar objetos específicos, alterar fundos e gerar novas imagens a partir do zero.