108K242
Türkçe Ulusal Derlemi Oluşturma
1001 - Araştırma Projesi
Proje Yürütücüsü İletişim Bilgileri
Prof. Dr. Sera Yeşim AKSAN
324 361 00 01 - 4652
Türkçe Ulusal Derlemi Oluşturma projesi ile 4500
farklı metinden seçilen 50 milyon sözcüklük Türkçe
veri, bilimsel ölçütlere uygun olarak toplanmış ve
bilgisayar ortamına aktarılmıştır. Dünyadaki benzer
örnekleri gibi Türkçe Ulusal Derlemi (TUD) web-
tabanlı bir arayüz üzerinden, Türkçe sözcüklerin
olası tüm kullanımlarını, gerçek ve güncel dil
verisine gereksinim duyan tüm kişi ve kurumların
kullanımına sunmaktadır.
adresi üzerinden yayınlanan TUD, pek çok alanda
kullanıcıları Türkçe’nin gizemleriyle buluşturmakta
ve Türkçe’nin 1990-2009 yılları arasında gerçekte
nasıl kullanıldığını gözler önüne sermektedir.
Türkçe Artık
Bilgisayarınızda
Mersin Üniversitesi
Prof. Dr. Sera Yeşim AKSAN
Prof. Dr. Mustafa Ş. AKSAN
Doç. Dr. Ahmet H. KOLTUKSUZ
Dil derlemi, belli amaçlar temelinde yapılandırılmış metinler bütünüdür. Farklı
türlerden yazılı ya da sözlü verinin elektronik ortamda bir araya getirilmesiyle
oluşturulan milyonlarca sözcükten oluşan derlemler, bu büyük veri üzerinde
dil ve dilin olası tüm kullanımlarına ilişkin her konunun sorgulanabileceği veri
tabanlarıdır. Bilgisayar teknolojilerindeki hızlı gelişmeler sayesinde gerçek dil
kullanımını içeren büyük derlemler oluşturulabilmiş ve bu derlemler üzerinden
yürütülen çalışmalar ile dilin başka yöntem ve araçlarla görülemeyen pek çok
önemli özelliği ortaya çıkarılmıştır. Günümüzde çok sayıda dilin özel ya da genel
amaçlı derlemleri kurulmuş ve kullanıcıların hizmetine sunulmuştur. Türkçe
Ulusal Derlemi Oluşturma projesinde, Türkçenin kullanımlarını belirlemede
referans olabilecek bir derlem tasarlanmış ve oluşturulmuştur. Türkçe Ulusal
Derlemi (TUD) 50 milyon sözcükten oluşan, %98’i yazılı %2’si sözlü Türkçenin
kullanımlarından toplanan örnekleri içeren; veritabanını olabildiğince farklı konu
alanı ve metin türlerinden, 1990-2009 yıllarına ait örneklerin oluşturduğu dengeli
ve dili temsil gücüne sahip bir derlemdir. Derlem verisine erişme ve sorgulama
yapmak isteyen kullanıcılar için, ağ-tabanlı, kullanıcı dostu bir arayüz geliştirilmiştir.
Tasarım ölçütleri ve büyüklüğü açısından Türkçe için bir ilk olan TUD, hem derlem
tasarlama, oluşturma ve son kullanıcıya sunma aşamaları bakımından benzer
çalışmalara örnek olacak hem de derlem temelli araştırmalara önemli katkılar
sağlayacaktır.
Bilişim, eğitim, medya, Türkçe’nin güncel kullanımı ve tanıtımı ile ilgili tüm kişi ve
kurumlar
Proje Sonuçları ile İlgili Olabilecek Sektör, Kurum ve Kuruluşlar
Projenin Amacı ve Önemi