Google Translate'de Güney Aşağı Frankonya dahil 110 yeni dil

Adanali

Member
Google birden fazla dili otomatik olarak çevirebilir. Google Çeviri çeviri hizmeti, başlangıçta kaynak diller için olmak üzere 133'ten 243 dile çıkarak neredeyse iki katına çıkacak. Veri şirketi bunu perşembe günü duyurdu. Spektrum, Kantonca veya Pencapça (Shahmukhi alfabesi varyantında) gibi çok sayıda konuşmacının bulunduğu dillerden, Güney Düşük Frankoniyen veya güney Brezilya'da kullanılan Rio Grande Hunsrück lehçesi gibi daha az yaygın lehçelere kadar uzanır.


Duyuru



Google çalışanı Isaac Caswell şirket blogunda “Artık desteklenen dillerin yelpazesini genişletmek için yapay zekayı kullanıyoruz” diye yazıyor. “Geniş dil modelimiz PaLM2 sayesinde şimdiye kadarki en büyük genişletmemiz olan Google Çeviri'ye 110 yeni dil sunuyoruz.” Daha geçen yıl Google Çeviri, kelime dağarcığını o dönemde 131 olan dil sayısını 33'e çıkardı ve buna ek olarak Çince yazı dilinin geleneksel ve basitleştirilmiş versiyonlarını da ekledi. Bu sefer Kantonca ayrı olarak eklendi. Caswell'in bildirdiğine göre, bunun öğrenilmesi özellikle zordu, “çünkü Kantonca yazılı olarak Mandarin Çincesi ile sıklıkla örtüşüyor.” Bu, Kantonca metinleri otomatik olarak aramayı ve bunları Büyük Dil Modeline (LLM) dahil etmeyi kolaylaştırmaz.

Yüzyıllardır Almanya ve Avusturya'da da konuşulan Romanca, Avrupa genelinde çok sayıda lehçede yaygın olması nedeniyle programcılar için de zorluk teşkil ediyordu. Sonuç, hakkında konuşulmayan bir karışım üreten bir LLM'dir: Güney Vlax'ı temel alır, ancak aynı zamanda kuzey şubesi ve Balkan şubelerinin unsurlarını da içerir.

Yeni dillerin dörtte biri Afrika kökenlidir. Artık Portekizce'nin, tüm Portekizce konuşanların yalnızca bir azınlığı tarafından konuşulan ayrı bir çeşidi var: Portekiz'de yaygın olan dil versiyonu. Örneğin Jamaika, Mauritius, Papua Yeni Gine ve Seyşel Adaları'ndan çeşitli creole dilleri de dahildir. Siyasi açıdan patlayıcı yeni gelenler arasında Tibetçe, Osetçe ve Kırım Tatarlarının dili yer alıyor. Google, desteklenen yeni dillerin bir listesini yayınladı.

Grafik arayüz mücadelesi


Yeni teklifler henüz kullanıcı arayüzlerinde seçilemiyor. Bunun anlamı çeviriler dıştan yeni dillerle mümkün, ancak henüz değil İçinde yeni diller. Çevrimdışı çeviri paketleri henüz uygulamada bulunamıyor. Google'ın bu kadar çok dil için arayüzü nasıl tasarlayacağı henüz bilinmiyor. Şirket, bir gün içinde 1.000 dili birbirine otomatik olarak çevirmeyi hedef olarak belirledi. Bu, yaklaşık yedi dilden birini destekleyeceği anlamına gelir.

Her ne kadar diller giderek yok olsa da, hâlâ 7.000'den fazlası var. Bununla birlikte, bir dil ile bir lehçe arasındaki kesin ayrım zordur ve çoğu zaman (politik olarak) tartışmalıdır. Almanya'da Yidiş, Kuzey Frizce, Roman, Saterland dili, Sorb dili ve Güney Jutisk'in nesli tükenme tehlikesiyle karşı karşıyadır.

Halüsinasyonlar: Çiğniyor muyuz?


Google, Faroe Adaları'nın uzun süredir devam eden Google Çeviri tarafından desteklenme talebini nihayet yerine getirdiğini açıkladı. Ancak dil tanıma hala pratikte çalışmıyor. Faroe dilinde “Mær gongst væl, takk, og tygum?” ifadesi (“Ben iyiyim, teşekkürler, ya sen?”) Google Çeviri şu anda yanlış şekilde İzlandaca olarak okuyor. Sonuç şu Dadaist kötülük: “Lütfen, sızlanıp bizi çiğnemesine izin mi vereyim?”

Yanlışlıkla veya yanlışlıkla Google Çeviri'ye yanlış kaynak dili söylediğinizde tuhaf şeyler olur. Çünkü Google henüz yapay zekasına, örneğin “anlamıyorum” hata mesajı şeklinde boşlukları doldurma cesaretini öğretmedi. “Maer gongst væl, takk, og tygum?” “Almanca”dan İngilizceye çevrilen çıktıda şu yazıyor: “Sayıyoruz, değil mi ve merak ediyoruz?” Tersine, eğer İngilizce'yi yanlış belirtirseniz, sistem şu Alman sürprizini sanrı olarak görür: “Siz, babanız ve oğlunuz ne olacak?”




(ds)
 
Üst