O Google Tradutor agora é fluente em 110 idiomas adicionais, do abkhaz ao zulu
O Google está adicionando mais idiomas ao Google Translate – muito mais. Desta vez, 110 deles, incluindo Manx.
Isso é a maior expansão única de todos os tempos para a ferramenta de tradução do Google. Ela agora lida com 243 línguas diferentes, chegando perto de dobrar o número de línguas que lida.
A expansão é alimentada pelo PaLM 2, a versão mais recente do Pathways Language Model do Google, que ele introduzido em 2022 e então melhorou com versão 2 em maio de 2023.
O Google Tradutor vem aumentando gradualmente seu repertório ao longo dos anos, como O registro coberto em 2008 quando, entre outros, acrescentou o checo. Isso foi um salva-vidas para este abutre, quando ele se mudou para cá há uma década. Como temos descrito anteriormenteČeština é uma língua brutalmente complexa e difícil. No ano passado, seu correspondente se mudou para a Ilha de Man, que também tem sua própria língua indígena única, Manês.
Esta expansão, tal como a anterior mais modesta, 24 idiomas em 2022, usa um método que o Google chama Zero Shot tradução automática. O Google Tradutor vem usando modelos de redes neurais para tradução desde 2016, e o treinamento com recursos zero significa que é possível treinar seus modelos para traduzir idiomas, mesmo que o banco de dados de treinamento não inclua textos correspondentes um a um nos idiomas de origem e de destino.
Pela primeira vez, parece-nos que este é um excelente uso para os modelos de linguagem grandes e dolorosamente modernos que a geração atual de vendedores ambulantes está promovendo como IA. Os LLMs são uma forma de rede neural, e os “chips aceleradores de IA” que alguns fornecedores de silício gostariam que você acreditasse que deixam os computadores pensarem são principalmente coprocessadores dedicados para fazer matemática tensorial cálculos mais rápidos.
A tradução automática pode ser muito valiosa nos esforços para salvar línguas minoritárias. O manx voltou da extinção nas últimas duas décadas. O último falante nativo de manx, Edward “Ned” Maddrellmorreu em 1974, mas à medida que os falantes nativos restantes envelheceram, várias gravações e vídeos da língua sendo falada foram feitos, e hoje há uma nova geração de falantes nativos de manx sendo criados por adultos que a aprenderam como segunda língua, e até mesmo uma escola primária de língua manx, Escola Primária Gaelgagh.
Olá, Google e boa sorte. ®
Nota de inicialização
A lista completa de idiomas agora suportados é a seguinte:
Abkhaz, Acehnese, Acholi, Afar, Africâner, Albanês, Alur, Amárico, Árabe, Armênio, Assamês, Avar, Awadhi, Aymara, Azerbaijano, Balinês, Baluchi, Bambara, Baoulé, Bashkir, Basco, Batak Karo, Batak Simalungun, Batak Toba , Bielorrusso, Bemba, Bengali, Betawi, Bhojpuri, Bikol, Bósnio, Bretão, Búlgaro, Buryat, Cantonês, Catalão, Cebuano, Chamorro, Checheno, Chichewa, Chinês (Simplificado), Chinês (Tradicional), Chuukês, Chuvash, Córsega, Crimeia Tártaro, Croata, Checo, Dinamarquês, Dari, Dhivehi, Dinka, Dogri, Dombe, Holandês, Dyula, Dzongkha, cheque, Inglês, Esperanto, Estónio, Ewe, Faroês, Fijiano, Filipino, Finlandês, Fon, Francês, Frísio, Friuliano, Fulani, Ga, Galego, Georgiano, Alemão, Grego, Guarani, Gujarati, Crioulo Haitiano, Hakha Chin, Hausa, Havaiano, Hebraico, Hiligaynon, Hindi, Hmong, Húngaro, Hunsrik, Iban, Islandês, Igbo, Ilocano, Indonésio, Irlandês, Italiano, Patois Jamaicano, Japonês, Javanês, Jingpo, Kalaallisut, Kannada, Kanuri, Kapampangan, Cazaque, Khasi, Khmer, Kiga, Kikongo, Kinyarwanda, Kituba, Kokborok, Komi, Konkani, Coreano, Krio, Curdo (Kurmanji), Curdo ( Sorani), Quirguistão, Lao, Latgaliano, Latim, Letão, Ligúria, Limburguês, Lingala, Lituano, Lombardo, Luganda, Luo, Luxemburguês, Macedônio, Madurês, Maithili, Makassar, Malgaxe, Malaio, Malaio (Jawi), Malayalam, Maltês, Mam, Manx, Maori, Marathi, Marshallês, Marwadi, Crioulo Maurício, Meadow Mari, Meiteilon (Manipuri), Minang, Mizo, Mongol, Mianmar (Birmanês), Nahuatl (Huasteca Oriental), Ndau, Ndebele (Sul), Nepalbhasa (Newari ), Nepalês, Nko, Norueguês, Nuer, Occitano, Odia (Oriya), Oromo, Ossétio, Pangasinan, Papiamento, Pashto, Persa, Polonês, Português (Brasil), Português (Portugal), Punjabi (Gurmukhi), Punjabi (Shahmukhi) , Quechua, Q’eqchi’, Romani, Romeno, Rundi, Russo, Sami (Norte), Samoano, Sango, Sânscrito, Santali, Gaélico Escocês, Sepedi, Sérvio, Sesotho, Crioulo Seichelense, Shan, Shona, Siciliano, Silésio, Sindi , cingalês, eslovaco, esloveno, somali, espanhol, sudanês, leite, suaíli, swati, sueco, taitiano, tadjique, tamazight, tamazight (Tifinagh), tâmil, tártaro, telugu, tétum, tailandês, tibetano, tigrínia, tiv, tok pisin , Tonganês, Tsonga, Tswana, Tulu, Tumbuka, Turco, Turcomano, Tuvan, Twi, Udmurt, Ucraniano, Urdu, Uigur, Uzbeque, Venda, Veneziano, Vietnamita, Waray, Galês, Wolof, Xhosa, Yakut, Iídiche, Iorubá, Yucatec Maia, Zapoteca e Zulu.