Meta

Vivendo no futuro

Andrew Bosworth, CTO da Meta e Head do Reality Labs

Destaques

  • As duas apostas de longo prazo da Meta em tecnologias do futuro – IA e metaverso – deram passos importantes em 2023. E, o mais importante, elas começaram a se cruzar.
  • O progresso que tivemos em 2023 significa que a IA generativa está entrando no foco dos aplicativos mais populares do mundo, a realidade mista está agora no centro do mercado de headsets e os óculos inteligentes Ray-Ban Meta permitirão que a IA veja o mundo a partir da nossa perspectiva pela primeira vez.
  • Acreditamos que uma das manifestações mais poderosas da IA de última geração serão os assistentes, como a IA da Meta, que podem entender o mundo ao seu redor e ajudá-lo durante todo o dia, eventualmente sem a necessidade de serem acionados.

Bill Gates disse certa vez que as pessoas “superestimam o que podem fazer em um ano e subestimam o que podem fazer em dez anos”. Os avanços individuais tendem a se acumular de forma não linear até que, de repente, o futuro entra em foco. Como diz o velho ditado, isso acontece de duas maneiras: gradualmente e depois de repente. Ao encerrarmos 12 meses de um progresso tecnológico feroz, acho que é justo dizer que 2023 foi um ano do tipo “repentino”.

No mês passado, comemoramos o décimo aniversário da fundação do FAIR, nosso laboratório de pesquisa Fundamental AI Research. Quando o anunciamos em 2013, havia uma enorme empolgação em todo o setor sobre o papel que a IA desempenharia no futuro, e as primeiras aplicações de aprendizado de máquina já estavam desempenhando um papel essencial no Facebook. Poucos poderiam imaginar naquela época o quão impressionante seria o progresso. De fato, mesmo há apenas dois anos, muitos poderiam ter questionado isso.

Ao olharmos para 2024, outro grande marco está chegando: serão dez anos desde que a Meta começou a trabalhar na plataforma de computação do futuro no Reality Labs. Essas duas tecnologias emergentes – IA e metaverso – representam as maiores apostas de longo prazo da Meta para o futuro. E, em 2023, começamos a ver esses dois caminhos tecnológicos se cruzarem na forma de produtos acessíveis a um grande número de pessoas.

IA

Na Meta, um dos destaques do ano foi a forma como o Llama e o Llama 2 foram adotados pela comunidade de desenvolvedores, tendo mais de 100 milhões de downloads, bem como melhorias constantes vindas de organizações do mundo inteiro à medida que elas melhoravam. Na Índia, a Jio, operadora de rede móvel, adequou-se rapidamente para criar uma nova ferramenta para atender seus mais de meio bilhão de clientes. A tabela de classificação do Open LLM da HuggingFace, por sua vez, foi preenchida com projetos impressionantes criados com o Llama 2 que estão liderando o caminho. Essas são apenas algumas das mais de 13.000 variantes do Llama hospedadas lá.

Como qualquer nova tecnologia, a IA terá maior impacto quando estiver disponível para todos. Não faz muito tempo que a capacidade de gerar belas imagens usando instruções de texto era efetivamente inacessível para a maioria das pessoas. Contudo, hoje estamos adicionando ferramentas como geração de imagens colaborativas, assistentes de conversação, ajudantes de escrita e editores de imagens inteligentes em produtos já usados por bilhões de pessoas ao redor do mundo.

MUDANÇA DE PLATAFORMA

A mudança que vimos no último ano sugere que há um caminho para que a IA se torne a principal forma de interação das pessoas com as máquinas. O cenário está pronto para novos tipos de dispositivos que podem perceber, entender e interagir com o mundo ao nosso redor de maneiras nunca antes possíveis.

Nossos óculos Ray-Ban Meta alimentados por IA mostram um desses caminhos. A IA da Meta, nosso novo assistente, combina visão e compreensão de linguagem para ver o mundo a partir de sua perspectiva e trabalhar com você para compreendê-lo. Estamos testando, também, novos recursos de IA multimodal nos óculos inteligentes. Com isso habilitado, eles podem traduzir um idioma estrangeiro que você está tentando ler ou até mesmo explicar a história de um edifício histórico que você está vendo. Eles podem fazer isso sem que você precise pegar um telefone ou utilizar um aplicativo.

Acreditamos que uma das manifestações mais poderosas da IA de última geração serão assistentes como esse, que podem entender o mundo ao seu redor e ajudá-lo ao longo do dia, eventualmente sem a necessidade de serem acionados. Os óculos são o formato ideal para isso – eles podem ver e ouvir o mundo do seu ponto de vista, já são socialmente aceitáveis, podem ser usados o dia todo e permitem que você fique totalmente presente no momento.

Na Reality Labs, investimos em anos de pesquisa sobre as tecnologias necessárias para avançar nesse sentido – coisas como sensores de baixíssima potência sempre ativos e sistemas de percepção de máquina capazes de compreender seu contexto. Não estamos apenas sendo pioneiros em um novo tipo de dispositivo, mas também estaremos o impulsionando nos próximos anos.

A realidade mista e a computação espacial representam outro caminho a seguir – estas não são simplesmente melhorias incrementais no paradigma da computação pessoal, que dominou nos últimos 50 anos -, mas sim representam uma mudança fundamental, que está apenas começando a entrar em foco.

Disponibilizar essas novas tecnologias para o maior número de pessoas tem sido uma das principais prioridades do Reality Labs há muitos anos, portanto, o lançamento do primeiro headset de realidade mista para o mercado geral em setembro foi outro destaque de 2023 para nós.

Poucos meses após o lançamento do Meta Quest 3, sete dos 20 principais aplicativos são aplicativos de realidade mista. Estamos vendo fortes sinais de que as pessoas realmente valorizam essas experiências – agora existem mais de 220 aplicativos Quest 3 em que a grande maioria dos usuários usa recursos de realidade mista. Ver o que acontece quando muitas pessoas colocam as mãos em uma nova tecnologia como esta foi maravilhoso:

Veremos a aceleração desse progresso em 2024, à medida que mais pessoas tiverem acesso à realidade mista e os desenvolvedores aprenderem a aproveitar seu potencial. Seja uma exibição imersiva da NBA no Xtadium ou uma abordagem totalmente nova para aprender música no Pianovision, já estamos vendo a realidade mista proporcionar experiências que seriam impossíveis em qualquer outro tipo de dispositivo.

VISÃO A LONGO PRAZO

Fazer apostas de longo prazo em tecnologias emergentes não é fácil. Não é garantido que vá funcionar e certamente não é algo barato. É também uma das coisas mais valiosas que uma empresa de tecnologia pode fazer e a única maneira de permanecer relevante com o passar do tempo. Ver as duas maiores apostas tecnológicas de longo prazo da Meta amadurecerem e se interligarem este ano foi um lembrete extremamente poderoso da importância de manter um investimento saudável em tecnologias futuras. E nos deu uma visão ainda mais clara da inovação que precisamos proporcionar durante a próxima década.

Na IA, isso significa avançar trabalhando intensamente no que vem a seguir: o que virá depois da atual geração de LLMs e da IA generativa? A maioria dos pesquisadores concorda que ainda há muitas oportunidades para construir modelos maiores e melhores de linguagem, imagem e vídeo com as tecnologias que temos hoje. Mas ainda existem avanços fundamentais e arquiteturas inteiramente novas a serem descobertas, e nossas equipes de pesquisa de IA na Meta estão no caminho certo para encontrá-las.

Isto significa investigação contínua em áreas como a IA incorporada, que visa construir modelos que experimentem o mundo da mesma forma que os humanos. O caminho para a IA de nível humano, segundo acreditam os nossos pesquisadores, exigirá sistemas que tenham uma compreensão mais profunda de como o mundo funciona, e as nossas equipes já estão fazendo progressos neste sentido, mas com anos de trabalho ainda pela frente.

E no Reality Labs, os nossos pesquisadores estão avançando em algumas das tecnologias mais promissoras, que tornarão a próxima plataforma de computação uma realidade possível. Ao longo dos anos, essa pesquisa levou a avanços como as lentes tipo “panqueca” no Quest Pro e no Quest 3, ou o protótipo incrível de Codec Avatars que o Mark Zuckerberg e o Lex Fridman testaram este ano. Mas esta é apenas a ponta do iceberg – e os avanços da pesquisa do Reality Labs nos permitirão lançar nos próximos anos uma série de produtos pioneiros no setor.

Mas de todas as coisas que mencionei aqui, as tecnologias mais valiosas hoje são aquelas que estão nas mãos das pessoas. O progresso alcançado em 2023 significa que a IA generativa está chegando ao coração dos aplicativos mais populares do mundo, a realidade mista está agora no centro do mercado de headsets e os óculos inteligentes permitirão que a IA veja o mundo da nossa perspectiva pela primeira vez. Este é um momento extremamente emocionante para estar construindo o futuro. Mais importante ainda – é um ótimo momento para viver nele.



Usamos cookies para ajudar a personalizar conteúdo, mensurar anúncios e fornecer uma experiência mais segura. Clicando ou navegando no site, você concorda em permitir a coleta de informações dentro e fora do Facebook por meio de cookies. Saiba mais, inclusive sobre os controles disponíveis: Política de Cookies