Türkçe Bilgi Kaynaklı Soru Yanıtlama Dizgesi (original) (raw)

Türkiye Türkçesinde Bilgi Kiplikleri

Konuşurun ruh durumundan izler taşıyan, düşüncesini yansıtan kiplerin dildeki işaretleyicileri olan kiplikler kodladıkları anlam alanlarına göre farklı kategorilere indirgenebilir. Bu çalışmada cümlede olasılık, kesinlik, delile dayalılık, çıkarım, varsayım, hayret, merak, şüphe gibi anlam alanlarını işaretleyen bilgi kiplikleri üzerinde durulmaktadır. Bilgi kiplikleri kesinliğin derecelerine, delile dayalılık bildirmelerine ve tahmin, çıkarım, varsayım gibi yorumsal değer taşımalarına göre üç temel başlık altında incelenmektedir. Kesinliğin derecelerini bildiren kiplikler kesinlik, yakın olasılık, uzak olasılık ve kesin dışılık semantiğini kodlamaktadır. Delile dayalılık kiplikleri; görsel, işitsel, duyusal gibi doğrudan delili göstermelerine göre doğrudan delile dayalılığı; aktarımsal ve çıkarımsal olmalarına göre de dolaylı delile dayalılığı belirtmektedir. Yorumsallık/yargısallık bildiren dolaylı olasılık temelli bilgi kiplikleri başlığı altında incelenen kiplikler ise tahmin, çıkarım, varsayım, şüphe, hayret, endişe, tereddüt ve merak semantiğini kodlamaktadır. Kipliklerin tespitinde Türkiye Türkçesi ile ortaya konmuş sözlü ve roman, hikâye, şiir, gazete yazısı, tiyatro gibi yazılı metinler esas alınmıştır. Yapılan taramalardan hareketle bilgi kipini işaretleyen -DIr, -mIş, -AcAk, -Abil-, -yor, -sA, mI gibi morfolojik; ya (da), ya …ya (da), ne… ne (de), diye, belki, galiba, herhalde, sanırım, acaba, evet, hayır, kim bilir, nasılsa gibi sözlüksel; söz dizimsel ve söyleme dayalı işaretleyiciler olmak üzere zengin bir kiplik sistemine rastlanmıştır.

Bir Soru Cevaplama Sistemi: BayBilmiş

bmbb.tc

Bilgiye erişimin en yaygın ve en kolay yollarından biri Internet, Internet'teki bilgiye erişimin en kolay yolu ise arama motorlarıdır. Ancak arama motorlarından istenilen bilgiye erişmek için önce uygun anahtar kelimeler seçmeli, daha sonra sonuç sayfaları yada sonuç sayfalarındaki bağlantılardaki sayfalar kullanıcı tarafından bizzat. incelenmelidir. Oysa kullanıcıların belirli tipteki soruları için tüm bu işlemleri otomatik hale dönüştürmek mümkündür ve İngilizce için birçok sistem geliştirilmiştir. Kullanıcısından sorusunu doğal dillerde kabul edebilen ve kullanıcısına cevabı bulması için sayfa adresleri listesi yerine cevabın kendisini verebilen sistemlere soru cevaplama sistemleri denmektedir. Bu çalışmada; Türkçe için doğal dille çalışan bir soru cevaplama sistemi gerçekleştirilmiştir. Sistem öncelikle kullanıcısının doğal dille sorduğu sorusunu arama motoru sorgusuna çevirmekte ve arama motorunun sonuç sayfasından yada bağlantılarındaki sayfalardan olası cevap cümlelerini seçmektedir. Olası cevap cümlelerini çeşitli kriterlere göre puanlandırıp en yüksek puanı alan ilk beş cümle kullanıcıya iletilmektedir. Sistem 524 adet soruyla değerlendirilmiş ve arama motorunun sonuç sayfası kullanıldığında soruların yaklaşık %43' üne, sonuç sayfasının bağlantılarındaki sayfalar kullanıldığında %60'ına ilk beş cümle içinde doğru cevap verebilmiştir. Absract The easiest and common way to achieve information is Internet. The easiest way to achieve information on Internet is using a search engine. But user most do extra processes (selection of keywords, research on result pages and web sites) while using a search engine. These extra processes can be done automatically for some kind of queries. The systems, that accepts user queries in natural language and results in only answer not a document list, are named Question-Answering Systems. The instances of these systems exist for English. In this study, a Question-Answering system is built for Turkish. The system converts user question in natural language to search engine query and sends these queries to a search engine and receives result page. In result page and the web pages which web addresses are in result page, the answer candidate sentences are selected. The candidate answers are ranked according to four criteria. The five candidates which have the highest scores are the answers. The system is examined with 524 questions. 43% of questions are answers correctly in first five sentences when the result page of search engine was used. 60% of questions are answers correctly in first five sentences when the real pages (at the result page's links) was used.

Evrişimsel Sinir Ağı Tabanlı Osmanlıca Belge Çözümleyici

International Journal of Advances in Engineering and Pure Sciences, 2021

Öz Osmanlıca, yüzyılları kapsayan bir tarihe ışık tutabilecek, onlarca neslin yaşantılarını, hayallerini, bilgi birikimini kapsayan zengin bir dildir. Ancak Arap alfabesini temel alan karmaşık yapısı ve Türkçe'nin ihtiyaçlarını karşılamakta zorlanması nedeni ile modern çağa uyum sağlayamamış ve değişime uğramıştır. Evrişimsel Sinir Ağları Tabanlı Osmanlıca Belge Çözümleyici projesi kapsamında, tarihi belgeler üzerinde araştırma yapmak isteyen insanların önüne çıkan yeni bir alfabe öğrenme zorluğunu gidermek ve Osmanlıca yazılmış belgeleri anlamalarını kolaylaştırmak için bir platform geliştirilmesi amaçlanmıştır. Platform, kullanıcının görüntüsünü verdiği Osmanlıca belgenin içinde kullanıcının çevirmek istediği metni seçmesini ve bu metnin perspektif dönüşüm ile düzeltilerek sonraki görüntü işleme adımlarına hazır hale gelmesini sağlayan bir araç bulundurmaktadır. Seçilen metin otomatik görüntü işleme yöntemleri ile satırlarına, kelimelerine ve karakterlerine ayrıldıktan sonra bir Evrişimsel Sinir Ağı (ESA, Convolutional Neural Network-CNN) kullanılarak metinde bulunan karakterler tanınmıştır. Arap alfabesi ve yazım kuralları nedeni ile birçok kelimede yazılmayan, ya da yazılıp telaffuz edilmeyen karakterler bulunmaktadır. Bu nedenle, kelimelerin düzenlenmesi gerekmektedir. Bu işlem ise Zemberek doğal dil işleme eklentisi kullanılarak yapılmış, metinde bulunan kelimelere karşılık gelebilecek kelimelerin önerilmesi amaçlanmıştır. Kullanıcıya Zemberek eklentisinin önereceği kelimeler arasında seçim yapma ya da kendi önerdiği kelimeyi girme imkânı tanınmıştır. Sonuç olarak sistemin satır ayırma başarısı %97, satırlar üzerindeki kelimeleri ayırma başarısı ise %96 olmuştur. Bununla birlikte uygun ayrılmış karakterler için %88,47 doğru sınıflandırma yapılmaktadır.

Metin Madenciliği ile Soru Cevaplama Sistemi

emo.org.tr

Baş döndürücü hızla büyüyen bilgi teknolojileri alanında giderek artan verilerden kullanışlı bilgi elde etmek önemi giderek artan bir konu olarak karşımıza çıkmaktadır. Bilgiyi elde etmede en az maliyetli, en iyi sonucu veren metotlar tercih edilmeye başlanmıştır. Bu bağlamda ...

Linked Data Üzerinden Doğal Dil Sorgularını Cevaplayan Sistem

Günden güne kullanıcısı sayısı öngörülemez bir hızla artan web, özellikle Web 2.0 ile birlikte kullanıcılarıyla olan etkileşimini artırmıştır. Ondan öncesinde web (Web 1.0) kullanıcılarına bilgi veren, tek yönlü bir iletişim içinde bulunan bir araçken, günümüzde kullanıcı etkileşimi üst düzeyde olan günlük hayatın vazgeçilmez bir parçası haline gelmiştir. Günümüzde kullanıcılar etkileşimli web sayfaları, arama motorları sayesinde isteklerine en kısa zamanda ulaşmayı amaçlamaktadırlar. Semantik Web diğer adıyla Web 3.0 ise bu adımı da bir adım öteye götürerek web'in sadece insanlar tarafından değil, makinalar tarafından da anlaşılabilir hale gelmesini amaçlamaktadır. Ortak bir ontoloji sayesinde web'deki bilgilerin tüm dünyayı açılması, erişilebilir olması amaçlanmaktadır. DBpedia projesi, 2007 yılında Wikipedia üzerindeki yapısal verilerin semantik veritabanlarında depolanarak web üzerinden tüm dünyaya sunulabilmesi için başlatılmıştır. Linked Data ise başta DBpedia, FreeBase ve YAGO olmak üzere dünyadaki bütün bu bilgi tabanlarının (knowledge base) birleştirilmesini sağlamak üzere kurulmuştur. DBpedia sunduğu bir servis sayesinde kendisinde tanımlı olan verilerin sorgulanmasını sağlamaktadır. Bu sorgulama için kullanılan dil SPARQL (SPARQL Protocol and RDF Query Language) olduğundan konunun uzmanları haricindeki kişiler için bir anlam ifade etmemektedir. Bu çalışmada İngilizce doğal dil sorgularını algılayıp, SPARQL sorgularına çevirerek bu servis üzerinden sorgulamayı sağlayan bir semantik web projesinin detayları anlatılacaktır.

Kavram Tabanlı Bilgi Geri Getirim Yaklaşımı

2007

Arama motorları, hem belgelerin yazarları hem de bilgi ihtiyaçlarını açıklayan kullanıcılar tarafından kullanılan sözlükler arasındaki farklar yüzünden ortaya çıkan uçurumlarla başa çıkmada yetersiz hale gelmişlerdir. Bu problemi azaltmanın bir yolu kavram tabanlı bilgi erişimini ortaya koymaktır. Bu çalışmada, bazı perspektiflerde RUBRIC sisteminin bir uzantısı olarak değerlendirilen ancak betimsel düzeyde erişime uygun farklı özellikler içeren bir erişim modeli önerilmekte ve elde edilen sonuçlar değerlendirilmektedir.

Türkçe Derlemler İçin Söz Dizimsel Görselleştirme ve Sorgulama Aracı

2017

Bu calismada, derlem, derlem turleri, mevcut Turkce derlemler ve Turkce bir derlemin etiketlenmesi gibi konular uzerinde durulmustur. Ayrica, Turkce derlemlerden etkili bir sekilde faydalanmayi saglayacak sorgulamalara imkan taniyan ve Turkce derlemlerdeki cumlelerin soz dizim agaclarini sozcuk turleriyle birlikte gorsellestiren bir arac gelistirilmistir.

Bulanık Mantık Temelli Esnek Sorgulama Aracı

bmbb.tc

Bu çalışmada, klasik veri tabanlarında bulanık sorgulama işlemini gerçekleştiren bir “esnek sorgulama aracı” geliştirilmiştir. Esnek sorgulama işlemi, veri tabanındaki kayıtlı tablolar üzerindeki nitelik değerlerinin bulanıklaştırılması işlemi ile gerçekleştirilir. Geliştirilen ...