Nuestro nuevo modelo de audio SAM transforma la edición de sonido

Destacados:

SAM Audio es el primer modelo de IA unificado que puede segmentar sonidos de mezclas de audio complejas utilizando indicaciones de texto, visuales y de intervalo de tiempo.
Esta tecnología tiene el potencial de transformar la edición de audio y video, e impulsar la innovación en áreas como música, podcast, TV, cine, investigación científica, accesibilidad y más.
Puedes descargar SAM Audio o explorar sus capacidades en el Segment Anything Playground desde hoy.

Hoy presentamos SAM Audio, un modelo de IA de última generación que te permite segmentar sonidos. Imagina grabar un video de tu banda favorita y aislar la guitarra o la voz con un solo clic, usar indicaciones de texto para filtrar el ruido del tráfico de un video grabado en exteriores, o eliminar el sonido de un perro ladrando de toda la grabación de tu podcast. SAM Audio, la última incorporación a nuestra colección Segment Anything, transforma el procesamiento de audio al facilitar el aislamiento de cualquier sonido de mezclas complejas utilizando indicaciones de texto, visuales y de intervalo de tiempo.

Este enfoque intuitivo refleja la manera en que las personas interactúan naturalmente con el sonido, haciendo que la separación de audio de nivel profesional sea más accesible y sencilla que nunca. SAM Audio tiene el potencial de transformar la edición de audio y video, e impulsar la innovación en áreas como música, podcast, TV, cine, investigación científica, accesibilidad y más.

Hasta ahora, la segmentación y edición de audio era un campo fragmentado, con una variedad de herramientas diseñadas para casos de uso específicos. Como modelo unificado, SAM Audio es el primero en admitir casos de uso que coinciden con la forma en que las personas piensan naturalmente sobre el audio, y logra un rendimiento de vanguardia en diversos escenarios del mundo real. SAM Audio admite tres tipos de indicaciones:

Indicaciones de texto: Escribe «ladrido de perro» o «voz cantando» para extraer sonidos específicos.
Indicaciones visuales: Haz clic en la persona u objeto en el video que está produciendo un sonido para aislar su audio.
Indicaciones de intervalo: Por primera vez en la industria, este método te permite marcar segmentos de tiempo donde ocurre el audio objetivo.

Estos métodos de indicación pueden usarse solos o en cualquier combinación, brindándote un control preciso e intuitivo sobre cómo se separa el audio. Vemos muchos casos de uso potenciales, incluyendo aislamiento de sonidos, filtrado de ruido y más, para ayudar a las personas a dar vida a sus visiones creativas, y ya estamos usando SAM Audio para ayudar a construir la próxima generación de herramientas creativas de medios.

Puedes probar SAM Audio en el Segment Anything Playground, nuestra nueva plataforma que permite a cualquier persona probar nuestros modelos más recientes. Desde hoy, las personas pueden seleccionar de nuestra colección de recursos de audio y video o subir los suyos propios para explorar las capacidades de SAM Audio. El modelo también está disponible para su descarga.

Estamos emocionados de incorporar el audio a la colección de modelos Segment Anything y creemos que SAM Audio es el mejor modelo integral de separación de audio disponible. Conoce más sobre SAM Audio y pruébalo en el Segment Anything Playground hoy mismo.

Destacados:

Noticias relacionadas