반응형

오늘, 우리는 SeamlessM4T를 소개합니다.
기본적인 다국어 및 다목적 모델로 음성과 텍스트를 원활하게 번역하고 전사합니다.
Seamless M4T는 다음과 같은 기능을 지원합니다.

- 거의 100개의 언어에 대한 자동 음성 인식
- 거의 100개의 입력 및 출력 언어에 대한 음성으로 텍스트 번역
- 음성에서 음성으로 번역, 거의 100개의 입력 언어와 35개의 출력 언어(+ 영어)를 지원합니다.
- 거의 100개의 언어에 대한 텍스트-텍스트 번역
- 텍스트-음성 번역, 거의 100개의 입력 언어와 35개의 출력 언어(+ 영어)를 지원합니다.

오픈 과학에 대한 우리의 접근법에 따라, 우리는 연구자와 개발자가 이 작업을 기반으로 할 수 있도록 CC BY-NC 4.0 https://creativecommons.org/licenses/by-nc/4.0/deed.ko 하에서 SeamlessM4T를 공개하고 있습니다.

[후략]

 

 

https://ai.meta.com/blog/seamless-m4t/

 

Introducing a foundational multimodal model for speech translation

Download the code, model, and data This blog post was made possible by the work of Bapi Akula, Pierre Andrews, Can Balioglu, Loïc Barrault, Onur Çelebi, Peng-Jen Chen, Yu-An Chung, Mariano Cora Meglioli, David Dale, Ning Dong, Paul-Ambroise Duquenne, Naj

ai.meta.com

https://huggingface.co/spaces/facebook/seamless_m4t

 

Seamless M4T - a Hugging Face Space by facebook

 

huggingface.co

 

반응형