Destaques:
- O SAM Audio é o primeiro modelo de IA unificado capaz de segmentar sons de misturas de áudio complexas usando prompts de texto, visuais e de intervalo de tempo.
- Essa tecnologia tem potencial para transformar a edição de áudio e vídeo, impulsionando inovação em áreas como música, podcast, televisão, cinema, pesquisa científica, acessibilidade e muito mais.
- Você pode baixar o SAM Audio ou explorar suas capacidades no Segment Anything Playground agora mesmo.
Hoje, estamos apresentando o SAM Audio, um modelo de IA de última geração que permite segmentar sons. Imagine gravar um vídeo da sua banda favorita e isolar a guitarra ou os vocais com um único clique, usar prompts de texto para filtrar o barulho do trânsito de um vídeo gravado ao ar livre, ou remover o som de um cachorro latindo de toda a gravação do seu podcast. O SAM Audio, a mais recente adição à nossa coleção Segment Anything, transforma o processamento de áudio ao facilitar o isolamento de qualquer som de misturas complexas usando prompts de texto, visuais e de intervalo de tempo.
Essa abordagem intuitiva reflete como as pessoas naturalmente interagem com o som, tornando a separação de áudio em nível profissional mais acessível e fácil do que nunca. O SAM Audio tem potencial para transformar a edição de áudio e vídeo e impulsionar inovação em áreas como música, podcast, televisão, cinema, pesquisa científica, acessibilidade e muito mais.
Até agora, a segmentação e edição de áudio era um espaço fragmentado, com diversas ferramentas criadas para casos de uso específicos. Como modelo unificado, o SAM Audio é o primeiro a suportar casos de uso que correspondem à forma como as pessoas pensam sobre áudio, alcançando desempenho de ponta em cenários reais e diversos. O SAM Audio suporta três tipos de prompts:
- Prompt de texto: Digite “latido de cachorro” ou “voz cantando” para extrair sons específicos.
- Prompt visual: Clique na pessoa ou objeto no vídeo que está emitindo um som para isolar o áudio correspondente.
- Prompt de intervalo: Inédito na indústria, esse método permite marcar segmentos de tempo onde o áudio desejado ocorre.
Esses métodos de prompt podem ser usados individualmente ou combinados, oferecendo controle preciso e intuitivo sobre como o áudio é separado. Vemos muitos casos de uso potenciais, incluindo isolamento de som, filtragem de ruído e muito mais para ajudar pessoas a realizarem suas visões criativas, e já estamos usando o SAM Audio para construir a próxima geração de ferramentas de mídia criativa.
Você pode experimentar o SAM Audio no Segment Anything Playground, nossa nova plataforma que permite que qualquer pessoa teste nossos modelos mais recentes. A partir de hoje, é possível selecionar entre nossa coleção de ativos de áudio e vídeo ou
fazer upload dos seus próprios para explorar as capacidades do SAM Audio. O modelo também está disponível para download.
Estamos animados em trazer o áudio para a coleção Segment Anything de modelos e acreditamos que o SAM Audio é o melhor modelo de separação de áudio disponível. Saiba mais sobre o SAM Audio e experimente no Segment Anything Playground hoje mesmo.