Bill Gates dijo una vez que “la mayoría de las personas sobreestiman lo que pueden hacer en un año y subestiman lo que pueden hacer en diez años”. Los avances individuales tienden a acumularse de forma no lineal hasta que, de repente, el futuro se vislumbra. Como dice el refrán, ocurre de dos maneras: gradualmente y de repente. A medida que nos acercamos al final de 12 meses de feroces avances tecnológicos, creo que es justo decir que 2023 fue un año «repentino».
El mes pasado celebramos el décimo aniversario de la fundación de FAIR, nuestro laboratorio de investigación de IA. Cuando lo anunciamos en 2013, había un enorme entusiasmo por el rol que la IA desempeñaría en el futuro, y las primeras aplicaciones de aprendizaje automático ya estaban desempeñando un papel esencial en Facebook. Pocos podían imaginar entonces lo impresionante que sería el progreso.
De cara a 2024, se acerca otro gran hito: hará 10 años que Meta empezó a trabajar en la plataforma informática del futuro en Reality Labs. Estas dos tecnologías emergentes, la IA y el metaverso, representan las mayores apuestas de Meta para el futuro. Y en 2023, empezamos a ver cómo estas dos vías tecnológicas se están cruzando en forma de productos accesibles a un gran número de personas.
IA
En Meta, uno de los aspectos más destacados del año fue la forma en que Llama y Llama 2 fueron adoptados por la comunidad de desarrolladores, con más de 100 millones de descargas, así como las constantes mejoras procedentes de organizaciones de todo el mundo a medida que iban mejorando. En la India, el operador de redes móviles Jio se adaptó rápidamente para crear una nueva herramienta al servicio de sus más de 500 millones de clientes. Por su parte, la clasificación Open LLM de HuggingFace se ha llenado de impresionantes proyectos creados con Llama 2 que están abriendo camino. Estas son sólo algunas de las más de 13.000 variantes de Llama alojadas allí.
Como cualquier tecnología, la IA tendrá mayor impacto cuando esté al alcance de todos. Hace poco, la capacidad de generar imágenes con instrucciones de texto era inaccesible para la mayoría de la gente. Hoy estamos añadiendo nuevas herramientas como la generación colaborativa de imágenes, asistentes conversacionales, ayudantes de escritura y editores inteligentes de imágenes que ya usan millones de personas en el mundo.
Un cambio de plataforma
El cambio que hemos visto en el último año sugiere que hay un camino para que la IA se convierta en la principal forma en que las personas interactúen con las máquinas. El escenario está preparado para nuevos tipos de dispositivos que pueden percibir, comprender e interactuar con el mundo que nos rodea de formas nunca antes posibles.
Las gafas Ray-Ban | Meta con IA son una muestra de ello. Nuestro nuevo asistente Meta AI combina la visión y la comprensión del lenguaje para ver el mundo desde tu perspectiva y trabajar contigo para entenderlo. También estamos probando nuevas funciones de IA multimodal que te permitirán, por ejemplo, traducir un idioma extranjero que estés intentando leer o incluso explicarte la historia de un edificio histórico que estés contemplando.
Creemos que una de las formas más potentes de la IA de próxima generación serán los asistentes de este tipo, capaces de entender el mundo que te rodea y ayudarte a lo largo del día, sin necesidad de que los actives. Las gafas son el formato ideal para ello: pueden ver y escuchar el mundo desde tu punto de vista, ya son socialmente aceptables, pueden llevarse puestas todo el día y te permiten estar plenamente presente en el momento.
En Reality Labs hemos invertido años de investigación en las tecnologías necesarias para avanzar en esta dirección: sensores de muy bajo consumo siempre activos y sistemas de percepción artificial capaces de entender el contexto. No sólo somos pioneros en un nuevo tipo de dispositivo, sino que lo impulsaremos durante años.
La realidad mixta y la computación espacial representan otro camino a seguir. No se trata simplemente de mejoras incrementales en el paradigma de la informática personal que ha dominado durante los últimos 50 años. Representan un cambio fundamental que apenas está empezando a vislumbrarse.
Poner estas nuevas tecnologías al alcance del mayor número posible de personas ha sido una de las principales prioridades de Reality Labs durante muchos años. El lanzamiento del primer dispositivo de realidad mixta para el mercado en general en septiembre fue otro de nuestros hitos en 2023.
A los pocos meses del lanzamiento de Meta Quest 3, siete de sus 20 aplicaciones principales son de realidad mixta. Vemos que las personas valoran estas experiencias: ya hay más de 220 aplicaciones de Quest 3 en las que la gran mayoría de los usuarios utilizan funciones de realidad mixta. Ver lo que ocurre cuando mucha gente se pone manos a la obra con una nueva tecnología como esta ha sido una experiencia encantadora:
En 2024 veremos cómo este progreso se acelera a medida que más personas accedan a la realidad mixta y los desarrolladores aprendan a aprovechar su poder. Bien sea para ver la NBA de forma inmersiva en Xtadium o para aprender sobre música en Pianovision, ya estamos viendo cómo la RM ofrece experiencias que serían imposibles en cualquier otro tipo de dispositivo.
Visión de largo plazo
Apostar a largo plazo por las tecnologías emergentes no es fácil. No está garantizado que funcione y, desde luego, no es barato. Pero también es una de las cosas más valiosas que puede hacer una empresa tecnológica y la única forma de seguir siendo relevante a largo plazo. Ver madurar y cruzarse este año las dos mayores apuestas tecnológicas a largo plazo de Meta ha sido un poderoso recordatorio de la importancia de mantener una inversión saludable en las tecnologías del futuro. Y nos ha dado una visión aún más clara de la innovación que necesitamos para la próxima década.
En lo que respecta a la IA, esto significa avanzar a toda máquina en lo que está por venir: ¿qué viene después de la actual generación de LLM y de IA generativa? La mayoría de los investigadores coinciden en que aún hay muchas posibilidades de crear modelos lingüísticos, de imagen y de vídeo mejores y más completos con las tecnologías actuales. Pero aún quedan por descubrir avances fundamentales y arquitecturas totalmente nuevas, y nuestros equipos de investigación de IA en Meta están en camino de descubrirlos.
Esto implica una investigación continua en áreas como la IA incorporada, cuyo objetivo es construir modelos que experimenten el mundo como lo hacen los humanos. El camino hacia una IA de nivel humano, creen nuestros investigadores, requerirá sistemas que comprendan mejor cómo funciona el mundo, y nuestros equipos ya están avanzando en este sentido, aunque aún quedan años de trabajo por delante.
Y en Reality Labs, nuestros investigadores están avanzando en algunas de las tecnologías más prometedoras que harán posible la próxima plataforma informática. A lo largo de los años, esta investigación ha dado lugar a avances como las lentes pancake de Quest Pro y Quest 3 y el asombroso prototipo de Codec Avatars que Mark Zuckerberg y Lex Fridman probaron este año.
Esto es sólo la punta del iceberg. Los avances en investigación de Reality Labs nos permitirán lanzar una serie de productos pioneros en el sector en los próximos años.
Pero de todo lo que he mencionado aquí, las tecnologías más valiosas son las que están hoy en manos de la gente. Los avances logrados en 2023 significan que la IA generativa se está abriendo camino en el corazón de las aplicaciones más populares del mundo, la realidad mixta es ahora el núcleo de unos auriculares para el mercado de masas y las gafas inteligentes permitirán a la IA ver el mundo desde nuestra perspectiva por primera vez. Es un momento apasionante para construir el futuro. Y lo que es más importante, es un gran momento para vivirlo.