© 2014 - M. Altıntaş tarafından ile tasarlandı
English (United Kingdom)Türkçe(Türkiye)

Giriş

Merhaba, Ben Mücahit.

Doğal dil işleme (NLP), büyük dil modelleri (LLM), makina öğrenmesi (machine learning), aktif öğrenme (active learning), derin öğrenme (deep learning) gibi disiplinlerden yararlanarak hayatı kolaylaştıran uygulamalar geliştirmekteyim. İstanbul Teknik Üniversitesi Bilgisayar ve Bilişim Mühendisliği Bölümü'nden doktora derecemi aldım. Aynı üniversitede araştırma görevlisi olarak da çalıştım. Doktora yaparken yaklaşık bir yıl Manchester Üniversitesi'nde konuk araştırmacı olarak bulundum. İTÜ Doğal Dil İşleme (NLP) Araştırma Grubu ve Marie Curie Mezunlar Derneği üyesiyim. Kasım 2022'den beri bir araştırma-geliştirme merkezinde kıdemli yapay zeka uzmanı olarak çalışıyorum.

Soru & Cevap

Neden böyle bir sayfa var?
Aslında bu sayfanın taslağını 2014 yılında hazırlamıştım, ancak içerik olarak ne koyacağıma karar veremediğim için bilgisayarımdaki tozlu dosyalardan biri olarak duruyordu. Zaman zaman bazı şeyleri hızlıca paylaşabilmek için böyle bir sayfanın varlığına ihtiyaç duymuşluğum oldu, ancak bazen yeterli zaman olmadığından, bazense attığım taş ürküttüğüm kuş muhabbetinden hep erteledim. Neyseki artık sayfa yayında. İçerik her ne kadar zenginleştirilmeye ihtiyaç duysa da tasarım olarak hiç de fena olmadı. İçeriğinin de zaman içinde gelişeceğini umuyorum. Tasarım olarak organik, ev yapımı bir sayfa olduğunu söylemeden de geçmeyeyim. Hadi bakalım hayırlısı..
Sayfadaki resimler sana mı ait?
Evet bir kısmı bana ait diyebilirim. Çektiğim resimlerden bir kısmını burada arkaplan olarak yayınlamak istiyorum. Güzel olanı yaymak gerekiyor en nihayetinde ;)
Sayfada arka planda çalan müzikler nereden?
Kendimce hoş bulduğum tüm dünya müziklerinden diyebilirim.
Doktora çalışma konusu neydi?
Bağlılık ayrıştırma. Sözdizimsel bir analiz yaklaşımı olup, cümleyi oluşturan kelimelerin ilişkilerini belirlemeyi amaçlar. Makine çevirisi, bilgi çıkarma, anlamsal analiz, soru cevaplama vb. gibi birçok doğal dil işleme (NLP) probleminin performansını artıran veya iyileştiren temel bir bileşen olarak kullanılır. Geçiş tabanlı bağlılık ayrıştırma teknikleri zengin bir özellik seti ve etkili hesaplama maliyeti sunarken, ayrıştırma performansları hata yayılımı nedeniyle grafik tabanlı bağlılık ayrıştırma yaklaşımlarının gerisinde kalmaktadır. Öte yandan, grafik tabanlı ayrıştırmadaki temel sorun, performansı iyileştirmek için özellik koleksiyonunun nasıl genişletileceğini belirlemektir. Bazı önceki araştırmalar grafik tabanlı algoritmaların özellik kapsamını genişletmeye çalışmıştır, ancak önerilen yöntemleri karmaşık bileşenler veya hesaplama açısından pahalı çıkarım yaklaşımları gerektirmektedir. Bu çalışmada, artırılmış küresel ve yerel özelliklerle grafik tabanlı bağlılık ayrıştırıcısının verimliliğini artırmak için alternatif bir teknik sunuyoruz. Deneysel sonuçlarımız önerilen geliştirmelerin bağlılık ayrıştırma performansını artırdığını göstermektedir. Ayrıca, hem Türkçe hem de İngilizce'de mevcut State of Art çalışmalarından daha iyi skorlar elde ettik ve sırasıyla Türkçe'de %82,60 ve %76,33, İngilizce'de ise etiketsiz (UAS) ve etiketli bağlanma puanlarında (LAS) %93,27 ve %91,34'e ulaştık. Bu çalışmaya Dr. A. Cüneyd Tantuğ danışmanlık yaptı. Daha fazla ayrıntıyı makalemizde bulabilirsiniz.
Yüksek lisansta ne çalıştınınız?
Yüksek lisans tezim, yapay zeka tekniklerini kullanarak yardım biletlerinin otomatik olarak sınıflandırılması ve hatta bazılarının otomatik olarak yanıtlanması üzerineydi. Müşteriler ve personel arasındaki fiziksel yüz yüze etkileşimin kaybı veya en aza indirilmesi, müşterilerin memnuniyetini olumsuz yönde etkiler. Günümüzün rekabetçi dünyasında, kuruluşlar ve şirketler destek hizmetlerinin kalitesini artırarak, hızlı yanıt vererek ve prosedür adımlarını en aza indirerek çevrimiçi destek sistemlerini iyileştirmelidir. Ayrıca, bir kuruluşta, değerli destek kaynaklarının daha iyi tahsisi ve verimli yönetimi, maliyetleri düşürmek için kritik öneme sahiptir. Kullanımda olan birçok destek sistemi, kuruluşların belirtilen taleplerini karşılamada etkili değildir. Bu çalışmada, sorun biletlerinin destek personelindeki ilgili kişiye veya birime otomatik olarak atanması, çevrimiçi aktif öğrenme tekniği kullanılarak gerçekleştirilmiştir. Müşterilerin memnuniyetini ve hizmet kalitesini iyileştirirken manuel çabaları ve insan hatalarını en aza indirmeyi amaçlıyoruz. Elde edilen sonuçlar, kuruluşların ihtiyaçları için değerli destek kaynaklarının daha iyi tahsisini ve etkili kullanımını sağlar. Bu çalışmanın danışmanlığını Dr. A. Cüneyd Tantuğ yürütmüştür. Çalışma hakkında daha fazla detaya buradan ulaşabilirsiniz.
Uluslararası ticarette ürünlerin GTIP (HS) kodlarının tahmini ile ilgili projenizi açıklayabilir misiniz?
HS kodu (Harmonize Sistem kodu), ticareti yapılan ürünleri kategorize etmek için standartlaştırılmış bir sayısal tekniktir. Dünya Gümrük Örgütü (WCO) tarafından oluşturulmuştur ve uluslararası ticarette ürünleri tanımlamak için yaygın olarak kullanılır. HS kodu genellikle altı hane uzunluğundadır, ancak bazı ülkeler kendi ihtiyaçlarına göre kategorizasyon için fazladan haneler ekleyebilir. Doğal dil işleme yöntemleri kullananılarak geliştirilen bu proje, ürüne özel GTIP önermek için geliştirilmiştir.
Telefon görüşmelerinin analizine ilişkin projenizden bahsedebilir misiniz?
Bu proje, destek yeteneklerini geliştirerek iletişim merkezlerini ve müşteri hizmetleri ekiplerini güçlendirmek için tasarlanmıştır. Gelişmiş konuşmadan metne ve konuşmacı günlükleme algoritmalarını kullanarak sistem, daha fazla netlik ve analiz için bireysel konuşmacıları belirleyip segmentlere ayırarak aramaları yazıya döker. Geliştirilen sistem konuşmanın ana temasını algılama, müşteri duygusunu, aciliyetini veya uyumluluk sorunlarını gösterebilecek önceden tanımlanmış terimleri yakalama gibi kabiliyetlere sahiptir. Doğal dil işleme (NLP) ve makine öğreniminden yararlanarak gerçeklenen bu proje yalnızca temsilcilerin daha hızlı yanıt vermesine yardımcı olmakla kalmaz, aynı zamanda iyileştirme alanlarını belirleyerek arama sonrası analizi de kolaylaştırır. Sonuç olarak, müşteri memnuniyetinin artmasına, operasyonel verimliliğin optimize edilmesine ve müşteri hizmetleri temsilcilerinin sürekli olarak becerilerinin geliştirilmesine katkıda bulunur.
DoLES (Document Layout Extraction System) nedir?
Bir belgenin içeriğinin otomatik olarak anlaşılması, işlem sürecini hızlandırmak ve hataya açık insan emeğini en aza indirmek için kritik öneme sahiptir. DoLES çalışmasında, belgenin OCR (Optik Karakter Tanıma) ile elde edilen metin içeriği ve belgenin eşleşen bölümlerinin görselleri, belgedeki her bir bileşene (logo, kelime, imza vb.) bir etiket atamak için kullanılır. Eğitim setini oluşturmak için açık kaynaklı Label Studio Platformu kullanılmıştır. Geliştirilen sistem, %95 F1 skor ile ilgili alanları doğru bir şekilde tespit edebilmektedir.
Projelerinizde haber takip sistemi de var. Bunu açıklayabilir misiniz?
Belirli bir konu ile ilgili güncel mevzuat ve haberleri takip etmek ve bunları ilgili müşterilere iletmek ciddi zaman ve emek gerektiren bir iştir. Bu proje bu işi otonom hale getirmeyi amaçlamaktadır. İlgili içeriklere web kazıma yöntemleri ile erişilmiş ve içeriğin ilgililiği NLP yöntemleri ile belirlenmiştir. Bu projede Selenium, Büyük Dil Modelleri, Flask API, SMTP teknolojileri kullanılmıştır.
'Yapay Zeka Destekli Doküman Yönetim Sistemi' isimli projenizden bahsedebilir misiniz?
Geliştirilen yapay zeka destekli doküman yönetim sistemi sayesinde yüzlerce farklı belge türü %97 başarı oranıyla doğru bir şekilde tanımlanabilir. Belgenin sınıfı hem optik karakter tanıma (OCR) hem de belge görsel resimleri kullanılarak belirlenir.
Bir sorgu ile ilgili metindeki önemli anahtar kelimeleri çıkarma projenizden bahsedebilir misiniz?
Yapay zeka yaklaşımları insan yaşam kalitesini çeşitli şekillerde artırır. Bu projede hekimlerin tedavi sürecini iyileştirmek amacıyla hasta notları içerisinde verilen sorgu ile ilgili anahtar kelimeleri bulmasını sağlayacak bir asistan oluşturulmuştur. Önerilen yaklaşım, NBME Klinik Hasta Notları veri setinde insan uzmanlar tarafından açıklanan ilgili terimlerin %87'sini keşfedebilir.
Tekrarlı ortalama temel düzeltme (Iterative Averaging Baseline Correction) yönteminin genişletilmiş versiyonu nedir?
Temel düzeltme (baseline correction), nefes akış hacmi gibi sensörlerden gelen verilerde kullanılan bir ön işleme tekniğidir. Bu çalışmada, temel belirleme için yinelemeli ortalama alma yaklaşımı, geliştirilmiş giyilebilir piezoelektrik hava akışı dönüştürücü sensörü için kullanılmak üzere genişletilmiştir. Bu çalışmaya Dr. Yi Li danışmanlık etmiştir.
Tekstil yapısına gömülü giyilebilir sensörler ile aktivite tanıma üzerinde çalıştınız. Bunun hakkında daha fazla bilgi verebilir misiniz?
Bu çalışmada, aktivite tanıma işleminin tüm aşamaları; tasarım, veri toplama ve model geliştirme ele alınmıştır. Sensör tabanlı bir aktivite tanıma sistemi tasarlamak için temel gereksinimler; ölçüm sıklığı, denek sayısı, sensörlerin konumu ve sensör tipleri incelenmiştir. Veri toplama prosedürleri ve toplanan veriler tanıtılmıştır. Farklı özellik alanları; spektrogram, dalgacık ve zaman ve derin öğrenme modelleri; CNN, LSTM ve bunların hibritleri incelenmiştir. En son teknolojiye göre karşılaştırılabilir tanıma performansları elde edilmiştir. Bu çalışma, Marie Skłodowska-Curie hibe sözleşmesi No 644268 kapsamında Avrupa Birliği'nin Ufuk 2020 araştırma ve inovasyon programından fon almıştır. Bu çalışmaya Dr. Yi Li ve Dr. Senem Kurşun Bahadır danışmanlık yapmıştır.

soru & cevap giriş