O projeto foi inspirado no Peixe Babel, o tradutor universal da série O Guia do Mochileiro das Galáxias. Pesquisadores da Meta, a empresa responsável pelo Facebook, Instagram e WhatsApp, criaram um sistema de inteligência artificial que traduz comunicações por voz ou texto de forma quase instantânea em até 101 idiomas. Este sistema está disponível em formato de código aberto, destinado a usos não comerciales.
Chamado de SEAMLESSM4T (Massively Multilingual and Multimodal Machine Translation), o sistema é capaz de traduzir e converter fala para texto, texto para fala, texto para texto e fala para fala. Em termos de línguas, a inteligência artificial consegue reconhecer a fala de 101 idiomas, o texto de 96 e gera fala traduzida com uma voz sintética em 36 idiomas. Segundo a revista Nature, a maioria dos dados utilizados para treinar a máquina é em inglês, o que cria uma desigualdade que limita a variedade de idiomas que pode ser incluída no treinamento. No entanto, a quantidade de dados não é significativamente baixa para outras línguas.
Os desenvolvedores da Meta afirmam que aprimorar os sistemas de tradução multilíngues pode potencializar seu desempenho, mesmo em idiomas que possuem conjuntos de dados de treinamento mais restritos. Ao todo, 4,5 milhões de horas de gravações em várias línguas foram utilizadas para o treinamento do programa, o que equivale a 513 anos. Além disso, o sistema foi ajustado para minimizar o viés de gênero, evitando que traduza termos neutros em uma língua — como “nurse” em inglês — para suas versões de gênero em outros idiomas.
Embora seja um avanço significativo, especialistas na área de tradução ressaltam que o projeto ainda precisa ser avaliado de forma rigorosa antes de sua implementação em setores médicos e jurídicos. Profissionais alertam que a tecnologia de inteligência artificial pode apresentar falhas, especialmente em relação a grupos linguísticos menos representados, e que a precisão é fundamental nesses contextos profissionais.