BLG621 Doğal Dil İşlemede İstatistiksel Yöntemler

(2012-2013 Bahar Dönemi, Doktora)

Yard.Doç.Dr. Gülşen Cebiroğlu Eryiğit

Doğal Dil İşleme Nedir?  

 

Doğal Dil İşleme’de istatistiksel yöntemler dersi ilk olarak Bahar 2011’de açılacaktır.

 

Önkoşullar: Doğal Dil İşleme (bknz: BLG505) ve Makine Öğrenmesi konularında bilgi sahibi olmak dersi almak için bir önkoşul olmasa da, başarıya katkıda bulunacaktır.

Yapay zekanın bir alt dalı olan Doğal Dil İşleme, insanların kullandıkları dili işlemeye yönelik teknikler geliştirmeyi amaçlar. Bu teknikler kullanılarak, insan makine iletişimini arttırma, makine ile çeviri yapma, hızlı bilgi çıkarımı gibi bir çok konuda uygulamalar geliştirilmektedir. Bu dersin amacı, Doğal Dil İşleme alanındaki modern istatistiksel yaklaşımları tanıtmak ve öğrencilere bu konuda araştırma yapabilme yetisi kazandırmaktır. Bu dersi başarı ile tamamlayan öğrencilerin bu konudaki güncel literatürü takip edebilir ve araştırma yapabilir düzeyde olmaları beklenmektedir.

Ders, makine öğrenmesi yöntemlerinin gerçek hayatta insanların kullandığı dilin işlenmesi için nasıl kullanılabilecekleri konusunu irdelemektir. Eğer makine öğrenmesinin üst düzey yapay zeka problemlerinde nasıl uygulandığı ile ilgileniyorsanız bu dersi almanızı tavsiye ederim. Ders konu anlatımı ve ortak araştırma projeleri şeklinde işlenecektir. Öğrencilerimden dönem içerisinde derse aktif katılmalarını, çeşitli projeler geliştirmelerini ve bu sayede derste öğrendikleri teknikleri birebir uygulamalarını beklemekteyim.

 

Ders sunuları için:

http://ninova.itu.edu.tr/tr/dersler/fen-bilimleri-enstitusu/1262/blg-621/

Dersin Haftalık Planı:

1.Giriş – Dersin Tanıtımı, DDİ seviyeleri, Derlemler ve Matematematiksel Altyapı Başlangıç
2.Matematiksel Altyapı
3.Kısa Sınav (ilk iki hafta) , Bayesci İstatistik, Değerlendirme Metrikleri
4.Temel Enformasyon teorisi
5.Birlikteliklerin bulunması
6.N-gram Dil modelleri    + 1 saat Vize
7.Sözcük sınıfı etiketleme (HMM, naive bayes)
8.Sözcük sınıfı etiketleme (Maximum Entropy ve MEMM)
9.Bir sınıflandırma problemi olarak DDİ (Bellek Tabanlı Öğrenme)
10.Etiketleme Ödev Sunumları
11.Bağlılık Ayrıştırması (Ayırdedici Sınıflandırıcılar ile SVM)
12.Bağlılık Ayrıştırması (Çizge tabanlı Yöntemler, Perceptron)
13.Sözcük Anlam Belirsizliği Giderme
14.Dönem Projesi İlerleme Sunumu.

Ders Kitapları:

Derste takip edilen tek bir kaynak kitap bulunmamaktadır:

Ancak aşağıdaki kitaplar öğrencilerin bu konudaki araştırmalarına bir başlangıç oluşturacaktır. Ders sunularında bu kitaplardan ve çeşitli güncel yayınlardan alıntılar yapılmıştır:

k2
k1