Chamado "Hibiki", este instrumento de IA traduz em tempo real as palavras do utilizador do francês para inglês, tal como faria "um intérprete", disse à AFP o diretor de modelização da Kyutai, Neil Zeghidour.
O projeto contou também com a colaboração do antigo patrão da Google, Eric Schmidt.
O modelo, que pode funcionar num telefone sem ter necessariamente acesso à internet, reproduz a voz do utilizador, não sendo possível "controlá-lo com texto para que diga o que se quer", disse Zeghidour.
"Só pode traduzir algo que foi realmente dito", acrescentou, numa altura em que imagens e gravações de áudio falsificadas com recurso a IA proliferam na internet, alimentado a desinformação, salienta a agência francesa.
Treinado com dados públicos, o projeto está disponível gratuitamente em código aberto para todos os interessados.
"A ideia é ter um modelo que possa ser utilizado em viagem, durante videoconferências ou para 'streaming'", uma vez que o "Hibiki" é capaz de fornecer legendas em direto, explicou Neil Zeghidour.
Já em julho do ano passado, o laboratório tinha apresentado o "Moshi" que através da fala dos utilizadores gerava repostas faladas ou escritas, resultando em milhões de descarregamentos.
Lançado em novembro de 2023, o laboratório sem fins lucrativos, conta com cerca de 15 investigadores e dispõe de um financiamento de 300 milhões de euros.
Leia Também: Francesa Mistral lança agente IA de conversação Le Chat para telemóvel