O LlamaCon começou oficialmente. Nosso evento inaugural integra desenvolvedores do mundo todo que têm algo em comum: a paixão por construir com o Llama. Já se passaram pouco mais de dois anos desde o lançamento do Llama. Nesse período, ultrapassamos a marca de um bilhão de downloads e, o mais importante, consolidamos o Llama como uma referência no ecossistema de modelos abertos de IA. Desenvolvedores, startups, governos e empresas estão alcançando sucesso com o Llama, aproveitando suas capacidades para impulsionar a inovação, melhorar a eficiência e resolver problemas complexos.
Claro que não poderíamos reunir um grupo de desenvolvedores sem também compartilhar algumas ferramentas open source que facilitarão a exploração dos modelos Llama, acelerar o desenvolvimento e oferecer os recursos mais recentes de defesa e proteção. Confira o que estamos anunciando hoje e como você pode começar a usar nossos novos lançamentos.
Apresentando a prévia da API do Llama: a melhor das APIs de modelos fechados, com a flexibilidade dos modelos abertos
Queremos tornar ainda mais fácil para você começar a construir com o Llama rapidamente, ao mesmo tempo em que mantém controle total sobre seus modelos e pesos, sem se limitar a uma API. Hoje, estamos anunciando a API do Llama — nossa futura plataforma para desenvolvimento de aplicações com o Llama, que já está disponível em prévia gratuita e limitada.
A API do Llama oferece criação de chave de API com apenas um clique e ambientes interativos para explorar diferentes modelos Llama, incluindo os modelos Llama 4 Scout e Llama 4 Maverick, anunciados no início deste mês. Quando você estiver pronto para desenvolver sua aplicação, disponibilizaremos um SDK leve em Python e Typescript. A API do Llama também é compatível com o SDK da OpenAI, facilitando a conversão de aplicações existentes.
Sabemos que também é importante ter acesso a ferramentas que ajudem a personalizar e executar seus modelos de forma mais eficiente. Como parte deste lançamento, estamos disponibilizando ferramentas de ajuste fino e avaliação na nossa nova API, em que você poderá ajustar suas próprias versões personalizadas do novo modelo Llama 3.3 8B. Estamos oferecendo essa capacidade para ajudar a reduzir custos, além de melhorar a velocidade e a precisão. Você poderá gerar dados, treiná-los e depois usar nossa suíte de avaliações para testar facilmente a qualidade do seu novo modelo. Tornar as avaliações mais acessíveis e fáceis de executar ajudará a substituir suposições por dados concretos, garantindo modelos que realmente atendam às suas necessidades. A segurança e a privacidade dos seus conteúdos e dados são nossa prioridade. Não usamos seus prompts ou respostas de modelos para treinar nossos sistemas de IA. Quando você estiver pronto, os modelos que você construir na API do Llama serão seus, podendo levá-los para onde preferir hospedar — eles não ficarão limitados aos nossos servidores. Estamos introduzindo essas funcionalidades para clientes selecionados, com planos de expandir para mais usuários nas próximas semanas e meses. Isso abrirá novas possibilidades para desenvolvedores criarem modelos personalizados para todo tipo de caso de uso.
Esta prévia é apenas o primeiro passo para a API do Llama. Estamos animados em ver mais pessoas construindo com a nossa API e utilizaremos os feedbacks para aprimorar as próximas versões. Caso tenha interesse em se inscrever para uma das vagas limitadas da prévia gratuita, preencha este formulário.
Inferência rápida com a API do Llama
Estamos animados em anunciar uma colaboração com a Cerebras e a Groq para ajudar ainda mais desenvolvedores do Llama a alcançarem velocidades de inferência mais rápidas usando a API do Llama. O acesso experimental antecipado aos modelos Llama 4, impulsionados por Cerebras e Groq, já está disponível mediante solicitação, oferecendo uma maneira prática para desenvolvedores testarem e criarem protótipos de casos de uso antes de escalar com o provedor de sua escolha. Basta selecionar os nomes dos modelos Cerebras ou Groq na API para aproveitar essa funcionalidade e ter uma experiência simplificada, com todo o uso monitorado em um só lugar. Essa colaboração reforça o nosso compromisso em promover um ecossistema diversificado que ofereça flexibilidade e opções, e estamos ansiosos para expandir as parcerias com outros fornecedores para trazer ainda mais alternativas para quem constrói com o Llama.
Novas integrações do Llama Stack
Recebemos feedback de desenvolvedores sobre a necessidade de facilitar a implementação de aplicações com diferentes provedores de serviço. No último ano, colaboramos com parceiros para criar distribuições do Llama Stack para seus clientes corporativos finais. Este ano, estamos expandindo essas colaborações, incluindo a integração recentemente anunciada do Llama Stack com os microsserviços Nvidia NeMo, e trabalhando em parceria com empresas como IBM, Red Hat, Dell Technologies, entre outras, em novas integrações que serão anunciadas em breve. Junto com nossos parceiros, vemos o Llama Stack como o padrão do setor para empresas que buscam implantar soluções de IA em produção de forma simples e eficiente.
Novas proteções e recursos de segurança do Llama para a comunidade de modelos abertos de IA
Estamos comprometidos em oferecer aos desenvolvedores as melhores ferramentas e recursos para construir aplicações de IA seguras. Hoje, estamos lançando novas ferramentas de proteção do Llama para a comunidade open source, incluindo o Llama Guard 4, o LlamaFirewall e o Llama Prompt Guard 2. Também estamos compartilhando atualizações para ajudar organizações a avaliarem a eficácia dos sistemas de IA em operações de segurança com o CyberSecEval 4, além de anunciar o Programa Llama Defenders para parceiros selecionados. À medida que modelos de IA mais avançados se tornam disponíveis, acreditamos que este é um esforço importante para fortalecer os sistemas de software. Leia mais sobre nossas novas ferramentas de proteção open source e as últimas novidades em segurança de IA.
Conheça os vencedores do Llama Impact Grants
O Llama Impact Grants tem como objetivo fomentar a inovação e criar oportunidades econômicas por meio da IA open source. Hoje, estamos animados em anunciar os 10 vencedores internacionais da segunda edição do Llama Impact Grants. Com mais de 1,5 milhão de dólares em prêmios, essas bolsas apoiam empresas, startups e universidades que estão usando o Llama para impulsionar mudanças significativas. Os vencedores deste ano apresentam uma variedade de soluções, incluindo a E.E.R.S., dos Estados Unidos, que utiliza um chatbot baseado no Llama para ampliar o acesso da população a serviços cívicos, e a Doses AI, do Reino Unido, que transforma operações de farmácias com detecção de erros em tempo real. Outros vencedores de destaque incluem a Solo Tech, que oferece suporte de IA offline em comunidades rurais dos EUA, e a FoondaMate, uma ferramenta de estudos multilíngue que ajuda milhões de estudantes na África e em outros continentes.
Saiba mais sobre os vencedores do Llama Impact Grants.
O futuro é com modelos abertos
Temos orgulho de liderar a IA de modelos abertos com o ecossistema Llama na linha de frente dessa revolução. Com o Llama, desenvolvedores e empresas têm a liberdade de construir o que quiserem, sem limitações impostas por sistemas proprietários ou contratos restritivos. Essa flexibilidade, combinada com sua portabilidade e acessibilidade, faz do Llama a escolha ideal para quem busca aproveitar todo o potencial da IA.
Estamos comprometidos em ser um parceiro de longo prazo para empresas e desenvolvedores, oferecendo um caminho de transição contínuo a partir de modelos fechados. O Llama é acessível, fácil de usar e está permitindo que mais pessoas aproveitem os benefícios da IA, independentemente de seu nível de conhecimento técnico ou dos recursos de hardware disponíveis. Acreditamos no potencial da IA para transformar indústrias e melhorar vidas, e é por isso que estamos animados em continuar apoiando o crescimento e o desenvolvimento do ecossistema Llama para benefício de todos. Mal podemos esperar para ver o que você vai construir.