Meta

O futuro da IA: construído com Llama

Destaques

  • Llama se tornou, rapidamente, o modelo mais adotado, com mais de 650 milhões de downloads do modelo e de seus derivados, o dobro dos downloads que tivemos há três meses. 
  • A Meta AI está a caminho de ser o assistente de IA mais utilizado no mundo até o final do ano, com quase 600 milhões de usuários ativos mensais.
  • A demanda pelo Llama continua aumentando em todo o mundo, com as aprovações de licenças mais do que dobrando nos últimos seis meses.

Um ano incrível para Llama 

O crescimento do Llama, nosso grande modelo de linguagem aberto, foi exponencial este ano graças ao ritmo acelerado de inovação e à abordagem aberta que adotamos para compartilhar atualizações com a comunidade de IA. Começamos o ano apresentando o Llama 3, a próxima geração do nosso grande modelo de linguagem aberto de última geração. Em julho, seguimos com o Llama 3.1, que incluiu o lançamento do parâmetro 405B, o primeiro modelo de IA aberto de nível de fronteira.. Mantendo o ritmo da inovação, anunciamos o Llama 3.2 no Connect 2024, compartilhando nossos primeiros modelos multimodais, bem como modelos pequenos e médios e leves, apenas de texto, que se adaptam a dispositivos móveis e de borda. E, para encerrar o ano, lançamos o Llama 3.3 70B, um modelo apenas de texto que oferece um desempenho semelhante ao 3.1 405B por uma fração do custo de serviço.

Como compartilhado pelo fundador e CEO da Meta, Mark Zuckerberg, o Llama se tornou rapidamente o modelo mais adotado, com mais de 650 milhões de downloads dele e de seus derivados, o dobro de downloads que tivemos há três meses. Colocando isso em perspectiva, os modelos Llama já foram baixados em média um milhão de vezes por dia desde nosso primeiro lançamento em fevereiro de 2023.

Atender à crescente demanda pelo Llama não seria possível sem a lista de parceiros que temos em todo o ecossistema de hardware e software, incluindo Amazon Web Services (AWS), AMD, Microsoft Azure, Databricks, Dell, Google Cloud, Groq, NVIDIA, IBM watsonx, Oracle Cloud, ScaleAI, Snowflake e muito mais. Este crescente conjunto de parceiros representa o melhor do ecossistema de tecnologia de IA e garante que o Llama seja otimizado para rodar em praticamente qualquer ambiente e em qualquer formato, incluindo no dispositivo e localmente on-premise, bem como APIs de serviço gerenciado de nossos parceiros de nuvem. O uso do Llama por volume mensal de tokens continuou a fazer um grande progresso, com o volume mensal de tokens em principais parceiros de nuvem crescendo mais de 50% mês a mês em setembro. 

Fora dos Estados Unidos, o Llama se tornou um fenômeno global este ano, com crescimento e apetite impressionantes por nossos modelos de desenvolvedores ao redor do mundo e um ritmo acelerado de adoção com o lançamento de nossa coleção de modelos Llama 3. As aprovações de licenças do Llama mais do que dobraram nos últimos seis meses em geral, com um crescimento notável nos mercados emergentes e um aumento dos downloads na América Latina, na região Ásia-Pacífico e na Europa. 

Além da alta demanda pelo Llama, ficamos animados em ver o sucesso que nossos parceiros tiveram este ano ao repetir nosso trabalho. A comunidade de enfoque aberto para IA publicou mais de 85.000 derivados do Llama somente no Hugging Face – um aumento de mais de 5x em relação ao início do ano. Esse engajamento e as contribuições da comunidade ajudaram a impulsionar decisões de produtos na Meta que informam melhor nossa próxima onda de modelos e recursos fundamentais a serem lançados dentro da Meta AI – e, finalmente, de volta à comunidade. 

Adoção crescente por empresas e governos 

À medida que mais pessoas recorrem aos nossos modelos abertos, lançamos novos recursos que tornam a construção do Llama uma experiência mais padronizada. Este ano, desenvolvemos o Llama Stack, uma interface para componentes de cadeia de ferramentas canônica para personalizar modelos Llama e construir aplicativos de agente. Acreditamos que oferecer a melhor ferramenta simplificada para construir o Llama só acelerará a incrível adoção que já testemunhamos em todos os setores.

Com base em nosso histórico de parcerias para promover a inovação de IA aberta, trabalhamos com a IBM para oferecer o Llama como parte de seu catálogo de modelos watsonx.AI, um estúdio empresarial de última geração para construtores de IA em todo o mundo para treinar, validar, ajustar e implementar modelos de IA. Esta parceria com a IBM significa que o Llama já está sendo usado por governos locais, grandes empresas de telecomunicações e até mesmo por um time de futebol profissional para ajudar a identificar potenciais novos atletas.

A empresa de pagamentos Block está integrando o Llama aos sistemas de suporte ao cliente por trás do Cash App. Como o modelo Llama tem um enfoque aberto para IA, a empresa pode experimentar e personalizar o modelo para cada um de seus casos de uso, ao mesmo tempo em que preservava a privacidade dos dados de seus clientes.

A Accenture recorreu ao Llama em 2024 quando recebeu uma solicitação de um importante órgão intergovernamental para criar um chatbot que seria o primeiro aplicativo de IA generativa de grande escala e voltado ao público da organização. Construído com o Llama 3.1, o chatbot opera na AWS e emprega várias ferramentas e serviços durante a personalização e inferência para garantir escalabilidade e robustez.

O Spotify usa o Llama para ajudar a oferecer recomendações contextualizadas, impulsionando a descoberta de artistas e criando uma experiência do usuário ainda mais rica. Ao combinar o amplo conhecimento global e a versatilidade do Llama com a profunda experiência do Spotify em conteúdo de áudio, o Spotify criou descrições que oferecem aos usuários insights personalizados sobre o conteúdo recomendado. A equipe também desenvolveu uma maneira para seus assinantes receberem narrativas personalizadas sobre novos lançamentos recomendados e comentários culturalmente relevantes de seus DJs de IA falantes de inglês e espanhol.

Recentemente, o LinkedIn compartilhou o Liger-Kernel, uma biblioteca de enfoque aberto para IA projetada para permitir um treinamento mais eficiente dos LLMs. Com base nessa infraestrutura escalável, o LinkedIn explorou uma variedade de LLMs para fazer o ajuste fino de tarefas específicas de sua rede social. Para algumas aplicações, eles descobriram que o Llama alcançou qualidade comparável ou melhor em comparação aos modelos básicos comerciais de última geração e a custos e latências significativamente menores. 

À medida que os modelos abertos continuam a melhorar a uma velocidade sem precedentes — e, em alguns casos, já estão excedendo os modelos fechados em certos recursos — 2024 foi o ano em que muitos usuários corporativos fizeram a troca. Este ano, vimos um avanço na Amazon Web Services (AWS) com clientes que buscavam opções, personalização e eficiência de custos, recorrendo ao Llama para criar, implementar e dimensionar aplicações de IA generativa. Em um caso, a Arcee.AI permitiu que seu cliente fizessem o ajuste fino dos modelos Llama em seus dados, resultando em uma redução de 47% no custo total de propriedade em comparação com LLMs fechados.

Além das empresas, a demanda do Llama por governos ao redor do mundo também cresceu. Este ano, trabalhamos para disponibilizar o Llama para o governo dos Estados Unidos. Devido à capacidade dos grandes modelos de linguagem de processar grandes quantidades de dados, raciocinar e gerar insights utilizáveis, eles estão posicionados para ajudar a impulsionar a eficiência e ajudar os funcionários do governo a melhorar a prestação de serviços públicos. Na Índia, o Ministério do Desenvolvimento de Habilidades e Empreendedorismo está utilizando o Llama com o objetivo de oferecer melhores resultados de aprendizagem e suporte aos alunos, enquanto na Argentina, o governo anunciou recentemente que irá otimizar a prestação de serviços públicos nacionais por meio do uso de um chatbot do WhatsApp criado com o Llama.

O assistente de IA mais acessível do mundo e uma nova classe de experiências sociais

O ritmo acelerado da inovação de modelos que entregamos ao longo do último ano também está tendo um efeito cascata em nossos produtos. Construída com Llama, a Meta AI está a caminho de ser a assistente de IA mais usada no mundo até o final de 2024, com quase 600 milhões de usuários ativos mensais.

Este ano, expandimos o acesso à Meta AI para mais países e em novos idiomas no WhatsApp, Instagram, Facebook, Messenger e na web. Até o final deste ano, prevemos que a Meta AI estará disponível em 43 países e uma dúzia de idiomas, e estamos ansiosos para levar o assistente para mais pessoas e lugares.

No WhatsApp, continuamos vendo sinais promissores de retenção e engajamento, o que coincidiu com a Índia e o México terem se tornado dois dos nossos maiores mercados para uso da Meta AI. Também há sinais de que a Meta AI está ajudando as pessoas a usar nossos aplicativos de novas maneiras, seja compartilhando imagens com a Meta AI para aprender sobre o mundo ao seu redor ou usando o assistente como um treinador para ajudar a impulsionar seus objetivos.

Em julho, lançamos o AI Studio, que se tornou o destino ideal para os criadores criarem  IAs que os ajudem a se conectar com seus públicos de maneiras novas, divertidas e úteis. Desde o lançamento, vimos centenas de milhares de IAs criadas, oferecendo dicas de culinária, memes, afirmações e muito mais. Recentemente, expandimos o acesso a personagens de IA em mais países e idiomas, incluindo Índia, Paquistão, México, Equador, Peru, Colômbia, Argentina e Chile. Em 2025, nossa meta é que o AI Studio seja o principal destino mundial para criação de personagens de IA.

Um modelo Llama personalizado também está alimentando a Meta AI em nossos populares óculos inteligentes Ray-Ban Meta, ajudando as pessoas a obter as informações de que precisam sem ter que pegar no smartphone. No mês passado, anunciamos que a Meta AI está sendo lançada nos óculos Ray-Ban Meta na França, Itália, Irlanda e Espanha, dando a mais pessoas a oportunidade de fazer coisas, se sentir inspiradas e se conectar com pessoas e coisas que lhes interessam diretamente de seus óculos.

E em todas as nossas plataformas, o Llama também está ajudando empresas ao potencializar nossa ferramenta de anúncios de geração de texto Advantage+ Creative para criar variações de texto em escala, enquanto modelos adicionais estão potencializando a geração de vídeo e imagem Advantage+ Creative e permitindo que empresas criem anúncios atraentes para ajudar a atingir o público certo. Muitos anunciantes estão vendo resultados fortes rumo à temporada de festas de fim de ano. A ObjectsHQ, uma plataforma de móveis modernos para pequenas empresas e comércio eletrônico, observou um aumento de 60% em seu retorno sobre o investimento em anúncios ao testar o recurso de geração de texto com as campanhas Advantage+ Creative.

2025 e o caminho a seguir

Ao olharmos para 2025, o ritmo da inovação só aumentará à medida que trabalhamos para tornar o Llama o padrão da indústria para construção em IA. O Llama 4 terá várias versões, impulsionando grandes avanços em todos os setores e permitindo uma série de novas inovações de produtos em áreas como fala e raciocínio.

Acreditamos que as experiências de IA vão se afastar cada vez mais do texto e se basear em voz, à medida que os modelos de fala se tornarem mais naturais, conversacionais e, o mais importante, úteis. Introduzimos a voz para a Meta AI em setembro em nossos aplicativos e temos planos para avançar esses recursos no primeiro semestre do ano que vem, para fornecer aos nossos produtos de IA mais utilidade e capacidade para os consumidores em nossos aplicativos e dispositivos.

Em outubro, anunciamos o Meta Movie Gen, nosso conjunto inovador de modelos de pesquisa para geração e edição de vídeo com IA. Vemos novas possibilidades incríveis para trazer essas experiências para nossos aplicativos, diminuindo o nível de acessibilidade e aumentando o teto para o que é possível criar e editar em vídeo com IA.

Também vemos ótimas oportunidades no próximo ano para a criação de sistemas de agentes de IA com raciocínio avançado. Estamos testando agentes comerciais que podem falar com clientes, fornecer suporte e facilitar o comércio, e estamos animados com o interesse que estamos vendo em nossas próprias plataformas de mensagens. Vemos esses sistemas de agentes também trazendo benefícios para os consumidores, pois buscamos criar assistentes de IA mais orientados para tarefas e que podem fazer coisas em seu nome, passando de uma experiência virtual para pessoal.

Estamos animados para continuar o impulso que despertamos à medida que avançamos para o novo ano. Continuaremos inovando rapidamente e compartilhando atualizações do Llama que permitirão que mais pessoas construam com a tecnologia mais avançada até o momento, juntamente com um grupo de produtos em rápida iteração e evolução. Todo esse trabalho continua dando suporte ao nosso objetivo final, que é construir o futuro da conexão humana e a tecnologia que a torna possível.