Selçuk Üniversitesi Edebiyat Fakültesi Dergisi (Dec 2020)
Türk ve Dünya Edebiyatından Eserlerin Doğal Dil İşlemeyle İncelenmesi
Abstract
Yayınevleri tarafından ilkokul, ortaokul ve lise seviyesindeki öğrenciler için okuma kitapları hazırlanmaktadır. Bu çalışmada ortaokul öğrencilerine yönelik olan eserler kullanılmıştır. 5 yayınevinden aynı isimli 5 Türk ve 5 dünya edebiyatından eser, doğal dil işleme teknikleriyle Türkçe dil bilgisi kuralları çerçevesinde analiz edilmiştir. Bu çalışmayla eserlerin yazımında ve eserlerdeki Türkçe kullanımında yayınevleri arasındaki farklılık ve benzerlikleri tespit etmek, aynı zamanda Türkçenin kullanım özelliklerini ortaya koymak amaçlanmıştır. İşlemlerin gerçekleştirilmesinde geliştirilen yazılım ve Türkçe doğal dil işleme kütüphanesi Zemberek kullanılmıştır. Eserlerin analiziyle elde edilen sonuçlar 5 yayınevinde oransal olarak benzeşmektedir ve yayınevleri arasındaki farklılıklar genel anlamda düşük seviyededir. Yalnızca çözümlenemeyen kelime sayısı, eserlerin ortalama cümle sayısı, eserlerdeki ortalama kelime sayısı, cümledeki ortalama kelime sayısı ve noktalama işaretlerinin (nokta ve virgül) kullanım oranında yayınevleri arasında ayrışma görülmektedir. Tüm eserler birlikte değerlendirildiğinde cümledeki ortalama kelime sayısı 6.45, kelimedeki ortalama harf sayısı 5.97 ve kelimenin ortalama hece sayısı 2.55’tir. Eserlerde en fazla kullanılan harfler A, E ve İ; en az kullanılanlar J, F ve P’dir. Kelimeler en çok B, K ve D; en az J, I ve L harfleriyle başlamakta ve en çok N, E ve A; en az C, B ve J harfleriyle bitmektedir. En çok kullanılan hece tipi sessiz-sesli, en az kullanılan hece tipi sesli-sessiz-sessizdir. Kelimelerin çoğunluğu ünlü ve ünsüz uyumuna uymaktadır. Ayrıca kelimelerin yaklaşık yarısı isim türünde ve ek almadan kullanılmıştır. Çekim eklerinin toplam kullanım sayısı yapım eklerinin toplam kullanım sayısından fazladır. 17 noktalama işaretinden 12 tanesi eserlerde yer almaktadır. Bununla birlikte farklı yayınevleri tarafından hazırlanıp yayımlanan aynı isimli eser içeriklerinin kısmen veya bütünüyle farklılaşabildiği görülmektedir.
Keywords