Elon Musk'ın Dediği Gibi 5 Yıl İçinde Dil Öğrenmeye Gerek Kalmayabilir mi?
elon musk'ın, yapay zekada kat edilen sürenin makine çevirisine bire bir yansıyacağını düşünmesi biraz üzücü olmuş. yapay zeka hakkında atıp tutan birini anlamanın en kolay yolunun bu konular olduğunu düşünüyorum. makine çevirisi konusunda devasa bir yol kat ettiğimiz doğru fakat bilim kurgu romanlarında ve bu tarz hype ürünlerinde bize vadedilen veya bu ürünlerle hedeflenen/arzulanan makine çevirisine ulaşmanın pek çok yönden zor olduğunu söylemem gerekiyor.
- makine çevirisi şimdiye kadar kural ve istatistik tabanlı çalışan sistemlerden oluşuyordu. mesela ingilizcede apple'ın türkçede elma anlamına geldiği kuralı sisteme tanıtılıyor. böylelikle sistem her apple gördüğünde kuralı uygulayarak elma girdisini getiriyordu.
- ardından insan etmenini biraz daha işin içine dahil etmek amaçlı istatistik tabanlı makine çevirisi sistemleri popülerleşmeye başladı. bunlar ise x sayıdaki denetlenmiş ve çevirisi onaylanmış(insanlar tarafından) metinleri birbirleriyle karşılaştırarak modeller kuran sistemlerdi. sistem bir nevi en çok kullanılan karşılığı kural olarak benimsiyor ve bu şekilde sonuçlar sunuyordu.
- google ve son dönemlerde yandex ile son kullanıcıların önüne nöral makine çevirisi(nmt) sunulmaya başladı. nmt, makine öğreniminde artan metin(corpus) sayısı, işleme gücü ve sinir ağları, knn, regresif modeller gibi tekniklerin nlp üzerinde uygulanabilirliğinin artmasıyla büyük bir atılım yaptı. sektörün içinde olan biri olarak açıkçası google'ın son atağından hem etkilendim hem de korktum diyebilirim. gelecekte çevirmenlere ve/veya dil öğrenmeye olan ihtiyacın bu tarz araçlar/sistemler sayesinde azalacağı aşikar fakat bunun değil önümüzdeki beş, 20 yıl içerisinde bile olacağını düşünmüyorum**. nedenlerine gelecek olursak:
- yapay zeka dediğimiz şey hala belli bir işte, süreçte hızlı bir şekilde çalışmaya odaklı sistemler. henüz genel yapay zeka geliştirecek teknolojiye erişemedik. haberlerde gördüğümüz kimi zaman insanlığı kurtarıcı, kimi zaman da yok edici bir "canlı" olarak yansıtılan modellerin çoğu özel bir işe odaklı if/else ve regresyon analizi algoritmaları. "buraya neden girdi şimdi bu?" dediğinizi duyar gibiyim. nedeni şu:
- dil dediğimiz şey ne kurallardan, ne istatistiklerden, ne de sadece metinlerden oluşan bir olgu. sosyal bilimlerde çalışanlar demek istediklerimi anlayacaktır. dil gibi insanlıkla iç içe bir olguyu neredeyse asla izole bir şekilde çalışıp, modelleyemezsiniz. çünkü dil aslında içinde bulunduğumuz kültür, ülke, aile gibi pek çok etmen tarafından etkilenen (para-dio ve idiokültürel katmanlar) bir olgu.
- ayrıca iletişimin etkin bir şekilde sağlanabilmesi için çeşitli olguların da tesis edilmesi gerek. örneğin iki kişinin arasında geçen bir ileti aktarımında (örn. basit bir diyalog) farkında olmasanız da pek çok konuda aynı koşullar üzerinde karar kılmış oluyoruz. bu koşullar da (mevcut programlama ve makine öğrenimi bilgime dayanarak) bir bilgisayara asla öğretilemeyecek olgulardan biri.
- bağlamsal ipuçları da bu tarz sistemlerin kavramakta ve öğrenmekte zorluk yaşayacağı bir faktör. örneğin: my sister was walking her dog when she suddenly decided to bolt across the street. it was very hard to stop her as she was so big.(kız kardeşim köpeğini gezdirirken köpek birden sokağın karşısına koşmaya başladı. köpek kocaman olduğu için onu durdurmak çok zordu.) biz buradan köpeğin karşıya koştuğunu ve büyük olduğu için durdurulamadığını anlıyoruz ancak bunu bir bilgisayara anlatmak için önce bir insan gibi köpeği öğretmek, köpeğin bazen böyle ani hareketler yapabileceğini anlatmak gerekir ki bağlamdan ipuçları elde ederek karşıya koşan büyük bir köpeğin varlığını çıkarabilsin.
- bir başka önemli noktada diller arası farklar. biraz önceki örnekten ilerleyecek olursak "my sister was walking her dog when she suddenly decided to bolt across the street. it was very hard to stop her as she was so big." her, she gibi kavramlar türkçede yok. biz üçüncü tekil kişileri cinsiyete göre ayırmıyoruz. en>tr türkçe dilbilgisi kurallarının "birleştirici" niteliği sayesinde işlevsel olabilir ancak tersi durumu düşünelim. kardeşim köpeğini gezdirirken köpek birden sokağın ortasına fırladı. hayvan kocaman olduğundan zorla durdurduk. tasvir edilen eylemdeki aktörler hakkında hiçbir bilgisi/birikimi olmayan bir makine çevirisi algoritması kardeşin ve köpeğin erkek mi kız mı, hayvan diyerek gerçekten de köpeğe mi referans verdiğimizi veya hayvanı gerçek anlamıyla mı (animalia krallığına mensup bir canlı) yoksa bizi sıkıntıya soktuğu için sinirden hakaret olarak mı kullandığımızı anlaması gerek (yine aslında yukarıda bahsettiğim kültürel birikim/artalan meselesine geliyoruz).
- mt sistemlerinin kavramakta büyük zorluk çekeceği bir diğer nokta ise tonlama. "nabıyon ya?" cümlesi tonlamaya göre selam verme, sinirlenme, atar-gider amacı alabilir. minimal tonlamalı bir metni bile yazıya çevirmekte güçlük çeken konuşma tanıma sistemlerinin yakın gelecekte bu tonlama nüanslarını kavrayabilecek seviyeye gelmesi neredeyse imkansız.
özetle, yakın gelecekte böyle bir sistem yüksek ihtimalle bulunmayacak. özellikle dil konusunda makine öğreniminin gideceği uzuuun bir yol var.