Meta

Apresentando a nossa nova geração de infraestrutura para IA

Destaques

  • Estamos apresentando a próxima geração de chips personalizados da Meta, projetados para as nossas operações de IA.
  • Esta versão mais recente tem um desempenho significativamente melhor em comparação com a última geração e ajuda a impulsionar os nossos modelos de classificação e recomendação de anúncios no Facebook e no Instagram.
  • Esses chips fazem parte do nosso crescente investimento em infraestrutura de IA e nos permitirão oferecer experiências novas e melhores em nossos aplicativos e tecnologias.

A próxima geração da infraestrutura de grande escala da Meta está sendo construída tendo a IA em mente, incluindo o apoio a novos produtos de IA generativa, sistemas de recomendação e investigação avançada em IA. É um investimento que esperamos que cresça nos próximos anos, à medida que os requisitos de computação para suportar modelos de IA aumentam juntamente com a sofisticação dos modelos.

No ano passado, lançamos o Meta Training and Inference Accelerator (MTIA) v1, o nosso acelerador de inferência de IA de primeira geração, que projetamos internamente com as operações de IA da Meta em mente. Ele foi projetado especificamente para os nossos modelos de recomendação de aprendizagem profunda, que estão melhorando uma variedade de experiências em nossos aplicativos e tecnologias.

O MTIA é uma aposta de longo prazo para fornecer a arquitetura mais eficiente para as operações exclusivas da Meta. À medida que as operações de IA se tornam cada vez mais importantes para os nossos produtos e serviços, essa eficiência será fundamental para a nossa capacidade de fornecer as melhores experiências aos nossos usuários em todo o mundo. O MTIA v1 foi um passo importante para melhorar a eficiência computacional da nossa infraestrutura e apoiar melhor os nossos desenvolvedores de software à medida que eles constroem modelos de IA que facilitarão novas e melhores experiências de usuário.

A próxima geração do MTIA faz parte de nosso maior programa de desenvolvimento full-stack para silício personalizado de domínio específico que atende às nossas operações e sistemas exclusivos. Esta nova versão do MTIA mais do que duplica a largura de banda de computação e memória da nossa solução anterior, ao mesmo tempo que mantém a nossa próxima ligação com as nossas operações. Ele foi projetado para servir com eficiência os modelos de classificação e recomendação que fornecem recomendações de alta qualidade aos usuários.

A arquitetura deste chip está fundamentalmente focada em fornecer o equilíbrio certo entre computação, largura de banda de memória e capacidade de memória para servir modelos de classificação e recomendação.

O MTIA foi implantado em nossos data centers e agora atende modelos em produção. Já estamos vendo resultados positivos deste programa, pois ele nos permite dedicar e investir em maior poder computacional para nossas operações de IA mais intensas.

Os resultados até agora mostram que o chip MTIA pode lidar com modelos de classificação e recomendação de baixa e alta complexidade, que são componentes-chave dos produtos da Meta. Como controlamos todo o montante, podemos obter maior eficiência em comparação com GPUs (unidades de processamento gráfico) disponíveis comercialmente.

Investimento contínuo da Meta em silício personalizado

A MTIA será uma peça importante do nosso cronograma para construir e dimensionar a infraestrutura mais poderosa e eficiente possível para as operações de IA exclusivas da Meta.

Estamos projetando o nosso silício personalizado para funcionar em cooperação com a nossa infraestrutura existente, bem como com hardware novo e mais avançado (incluindo GPUs de próxima geração), que poderemos aproveitar no futuro. Atender às nossas ambições para o nosso silício personalizado significa investir não apenas em silício de computação, mas também em largura de banda de memória, rede e capacidade, bem como em outros sistemas de hardware de próxima geração.

Atualmente temos vários programas em andamento que visam expandir o escopo do MTIA, incluindo suporte para operações de IA generativa. E estamos apenas no início desta jornada.