Faz pouco mais de um mês que lançamos o Llama 3.1, expandindo o comprimento do contexto para 128K, adicionando suporte a oito idiomas e introduzindo o primeiro modelo de IA de código aberto de nível avançado, o nosso Llama 3.1 405B. Assim como fizemos com os lançamentos do Llama 3 e do Llama 2, hoje estamos compartilhando uma atualização sobre os avanços e a adoção que estamos observando em todas as frentes.
O sucesso do Llama é possível graças ao poder do código aberto. Ao disponibilizar nossos modelos Llama abertamente, vimos um ecossistema de IA vibrante e diversificado ganhar vida, oferecendo aos desenvolvedores mais opções e capacidades do que nunca. A inovação tem sido ampla e rápida, desde startups que estão rompendo novas barreiras até empresas de todos os tamanhos que utilizam o Llama para desenvolver soluções próprias ou por meio de provedores de serviços em nuvem. A indústria está construindo e inovando com o Llama, e estamos ainda mais empolgados com o que está por vir.
Juntamente com o lançamento do Llama 3.1, Mark Zuckerberg compartilhou uma carta aberta sobre os benefícios da IA de código aberto, consolidando ainda mais nossa visão e compromisso com uma abordagem aberta. O código aberto está no DNA da nossa empresa, e o Llama tanto o incorpora quanto reforça o compromisso de compartilhar nosso trabalho de forma responsável. O código aberto promove um ecossistema mais competitivo, que é benéfico para os consumidores, para as empresas (incluindo a Meta) e para o mundo.
Em apenas 18 meses desde o nosso lançamento inicial, o Llama evoluiu de um único modelo de base de última geração para um sistema robusto para desenvolvedores. Com o Llama 3.1, oferecemos agora aos desenvolvedores um sistema de referência completo para criar mais facilmente seus próprios agentes personalizados, além de um novo conjunto de ferramentas de segurança e proteção para ajudar a criar com responsabilidade.
O principal modelo de código aberto
O ecossistema do Llama está crescendo rapidamente. Os modelos do Llama estão se aproximando dos 350 milhões de downloads no Hugging Face até o momento — um aumento de mais de 10 vezes em relação ao que tínhamos há cerca de um ano. Somente no último mês, os modelos do Llama foram baixados mais de 20 milhões de vezes no Hugging Face. E essa é apenas uma parte da história de sucesso do Llama, já que esses modelos também estão sendo baixados em serviços de nossos parceiros em todo o setor.
Além da Amazon Web Services (AWS) e do Azure da Microsoft, fizemos parcerias com a Databricks, Dell, Google Cloud, Groq, NVIDIA, IBM Watsonx, Scale AI, Snowflake e outros para ajudar os desenvolvedores a explorar todo o potencial dos nossos modelos. O uso do Llama hospedado, medido pelo volume de tokens, mais do que dobrou entre maio e julho de 2024, quando lançamos o Llama 3.1.
O uso mensal do Llama cresceu 10 vezes de janeiro a julho de 2024 entre alguns dos nossos maiores provedores de serviços em nuvem. Em agosto, o maior número de usuários únicos do Llama 3.1 em um dos nossos principais parceiros de serviços em nuvem foi da variante 405B, o que demonstra que nosso maior modelo de base está ganhando tração.
Aumentamos em cinco vezes o número de parceiros em nosso programa de acesso antecipado ao Llama com o Llama 3.1 e faremos mais para atender à crescente demanda dos parceiros. Recebemos contatos de diversas empresas que desejam se tornar futuros parceiros do LEAP e de integração do Llama, incluindo Wipro, Cerebras e Lambda.
Swami Sivasubramanian, vice-presidente de IA e dados da AWS: “Os clientes querem acesso aos modelos de última geração mais recentes para construir aplicativos de IA na nuvem, e é por isso que fomos os primeiros a oferecer o Llama 2 como uma API gerenciada e continuamos a trabalhar em estreita colaboração com a Meta à medida que novos modelos são lançados. Estamos entusiasmados em ver a adoção do Llama 3.1 pelos clientes do Amazon SageMaker e do Amazon Bedrock e ansiosos para observar como esses clientes utilizarão o modelo para resolver seus casos de uso mais complexos.”
Ali Ghodsi, CEO e cofundador da Databricks: “Nas semanas seguintes ao lançamento, milhares de clientes da Databricks adotaram o Llama 3.1, tornando-o nosso modelo de código aberto mais rapidamente adotado e mais vendido de todos os tempos. Esta geração de modelos Llama finalmente preenche a lacuna entre os modelos de código aberto e comerciais em termos de qualidade. O Llama 3.1 representa um avanço para os clientes que desejam construir aplicativos de IA de alta qualidade, mantendo controle total, personalização e portabilidade sobre seu modelo base.”
Jonathan Ross, fundador e CEO da Groq: “O código aberto vence. A Meta está construindo a base de um ecossistema aberto que rivaliza com os principais modelos fechados, e na Groq colocamos esses modelos diretamente nas mãos dos desenvolvedores — um valor compartilhado que tem sido fundamental para nós desde o início. Até o momento, a Groq forneceu a mais de 400.000 desenvolvedores 5 bilhões de tokens gratuitos diariamente, utilizando o conjunto de modelos Llama e nossa Inferência LPU. É um momento muito empolgante e temos orgulho de fazer parte dessa dinâmica. Não conseguimos aumentar a capacidade do Llama com a rapidez necessária. Se multiplicássemos por 10 a capacidade implementada, ela seria consumida em menos de 36 horas.”
Jensen Huang, fundador e CEO da NVIDIA: “O Llama teve um impacto profundo no avanço da IA de última geração. As portas estão agora abertas para que todas as empresas e indústrias construam e implementem supermodelos Llama personalizados usando o NVIDIA AI Foundry, que oferece o suporte mais amplo para modelos Llama 3.1 em treinamento, otimização e inferência. É incrível testemunhar o ritmo acelerado de adoção apenas no último mês.”
Mais animador do que o número de pessoas que estão usando o Llama é quem está utilizando o Llama e como estão fazendo isso.
Estamos observando uma preferência crescente da comunidade de desenvolvedores pelo Llama e fortes sinais de crescimento contínuo. De acordo com uma pesquisa da Artificial Analysis, um site independente de benchmarking de IA, o Llama foi o segundo modelo mais considerado e o líder do setor em código aberto.
Com mais de 60.000 modelos derivados no Hugging Face, há uma comunidade vibrante de desenvolvedores ajustando o Llama para seus próprios casos de uso. Grandes empresas como AT&T, DoorDash, Goldman Sachs, Niantic, Nomura, Shopify, Spotify e Zoom são apenas algumas das histórias de sucesso, e tanto a Infosys quanto a KPMG estão usando o Llama internamente. Vamos explorar mais a fundo.
Um panorama dos estudos de caso do Llama
A Accenture está usando o Llama 3.1 para criar um LLM personalizado para relatórios de ESG, com a expectativa de aumentar a produtividade em 70% e a qualidade em 20 a 30% em comparação com o método atual de geração do relatório anual de ESG da empresa. Com os avanços empolgantes em recursos multilíngues, a Accenture pode estender os modelos de IA para diversas regiões, ajudando, por exemplo, uma organização global a tornar os chatbots mais culturalmente conscientes e relevantes. A Accenture acredita que as empresas precisarão utilizar diversos modelos de IA de diferentes fornecedores. Modelos de código aberto como o Llama 3.1 ampliam as opções, aceleram a inovação e terão um efeito positivo em negócios e sociedade.
O atendimento ao cliente é uma área de foco para a inovação baseada em IA na AT&T. Por meio do ajuste fino dos modelos do Llama, a empresa conseguiu melhorar o atendimento ao cliente de forma econômica, compreendendo melhor as principais tendências, necessidades e oportunidades para aprimorar a experiência no futuro. No geral, o Llama e a GenAI proporcionaram uma melhoria de quase 33% nas respostas relacionadas a pesquisas nos atendimentos da AT&T, reduzindo custos e acelerando os tempos de resposta.
A DoorDash usa o Llama para simplificar e acelerar as tarefas diárias de seus engenheiros de software, como aproveitar sua base de conhecimento interna para responder a perguntas complexas da equipe e fornecer revisões de pull requests acionáveis para melhorar sua base de código.
A plataforma de IA da Goldman Sachs, conhecida como GS AI Platform, permite que os engenheiros da empresa utilizem os modelos do Llama para diversos casos de uso de forma segura e responsável, incluindo a extração de informações de documentos.
Para impulsionar o mundo virtual de seu primeiro jogo de realidade aumentada (RA) do gênero, Peridot, a Niantic integrou o Llama, transformando suas adoráveis criaturas, chamadas “Dots”, em animais de estimação de RA responsivos que agora exibem comportamentos inteligentes para simular a natureza dos animais reais. O Llama gera a reação de cada Dot em tempo real, tornando cada interação dinâmica e única.
A Nomura, instituição financeira japonesa líder de mercado, usa o Llama no AWS para obter benefícios chave, como inovação mais rápida, transparência, proteções contra vieses e desempenho robusto em resumo de texto, geração de código, análise de logs e processamento de documentos.
A Shopify continua a testar os melhores modelos de código aberto da categoria, incluindo o LLaVA, desenvolvido com base no Llama. Eles utilizam ajustes finos do LLaVA para várias tarefas especializadas e atualmente realizam de 40 a 60 milhões de inferências do LLaVA por dia, apoiando o trabalho da empresa em metadados e enriquecimento de produtos.
O Zoom utiliza seus próprios modelos, além de LLMs de código aberto e fechado, incluindo o Llama, para alimentar seu AI Companion, um assistente de IA generativa que ajuda os funcionários a evitar tarefas repetitivas. O AI Companion fornece resumos de reuniões, gravações inteligentes e próximas etapas para os usuários do Zoom, liberando mais tempo para colaborar, fazer conexões e concluir tarefas.
Um sistema aberto próspero
O Llama está liderando o caminho em termos de abertura, modificabilidade e eficiência de custos. Estamos comprometidos com a construção aberta e em garantir que os benefícios da IA sejam acessíveis a todos. Cada vez mais acadêmicos e empresários concordam que a IA de código aberto é o caminho certo a seguir.
Os LLMs podem nos ajudar a responder perguntas difíceis, melhorar nossa produtividade e estimular nossa criatividade. À medida que o ecossistema Llama se expande, também crescem as capacidades e a acessibilidade da IA da Meta. Nosso assistente inteligente está disponível no Instagram, WhatsApp, Messenger e Facebook, além da web. Também o trouxemos para o Meta Quest e a coleção Ray-Ban Meta, aproximando-nos da nossa visão de um futuro onde um assistente de IA contextual, sempre disponível em um formato conveniente e vestível, ajudará proativamente durante o seu dia.
Estamos empolgados com o crescimento da comunidade do Llama e animados por saber que estamos criando os modelos de linguagem de grande porte mais avançados e de código aberto para o mundo atual. Fique atento ao nosso blog nas próximas semanas e meses, pois continuaremos a compartilhar as incríveis formas como desenvolvedores e empresas estão encontrando valor com o Llama. Agradecemos aos desenvolvedores que estão trabalhando com o Llama. Como sempre, estamos ouvindo seus comentários e em breve traremos muitas outras atualizações.
Está começando a usar o Llama? Baixe os modelos mais recentes e comece a desenvolver hoje mesmo.