Türkçe Haber Metinlerinin Makine Öğrenmesi Yöntemleri Kullanılarak Sınıflandırılması (original) (raw)
Related papers
Türkçe Haber Metinlerinin Çok Terimli Naive Bayes Algoritması Kullanılarak Sınıflandırılması
Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 2021
Hızla gelişen teknoloji ile verilere erişmek oldukça kolaylaşmış ancak elde edilen bu veri yığınlarının işlenmesi ve analiz edilmesi ise büyük bir problem haline gelmiştir. Bu çalışmada çevrimiçi bir haber sitesinden metin halinde toplanan yazıların, metin madenciliği ile daha önceden belirlenmiş haber kategorilerine ayrılması sağlanmıştır. Metin halinde toplanan 2248 haber verisi için iki ayrı yöntem kullanılmış ve haberlerin, birinci yöntemde %95,24'ü ikinci yöntemde ise %99,86'sı doğru olarak sınıflandırılmıştır. Türkçe dilinin özgün yapısından kaynaklı sınıflandırma yapılmasının zorluğundan dolayı bu çalışma ileriki metin madenciliği uygulamaları için faydalı olacaktır. Ayrıca elde edilen sonuçlar, literatürde yer edinmiş benzer çalışmalar ile karşılaştırılarak analiz edilmiştir.
Türkçe Öğretiminde Haber Metinleri - Metin Yapısı Bağlamında Etkinlik Oluşturma
Ana Dili Eğitimi Dergisi, 2014
Dil öğretiminin amacı iletişim yetisini geliştirmektir. Çağdaş dilbilim çalışmalarında iletişimsel amaç önem kazanmış ve dil öğelerinin amaca göre seçilmesi ve kurgulanması sonucu metin, iletişim birimi; iletişimsel yetinin geliştirilmesi ise metin türü edincinin geliştirilmesi olarak ele alınmaya başlanmıştır. Bireyler dünyayı dilleriyle tanırlar, bu nedenle Türkçe dersleri öğrencileri yaşamda karşılaşacakları tüm iletişim ortamlarına, diğer deyişle tüm metin türlerini anlama ve anlatma durumlarına hazırlayacak içerik ve biçimde olmalıdır. Hayata eleştirel bakabilme ve fikir sahibi olabilme gündemi takip edebilmek ile mümkündür, bu bağlamda haber metinleri çok sık karşılaşılan ve dil öğretiminde atlanmaması gereken bir metin türüdür. Haber metinlerinin biçimsel, anlamsal ve üstyapı özelliklerini temel alan etkinliklerle öğrenciler haber türünü daha iyi çözümleyebilecek ve eleştirel bakış açısı kazanabilecektir. Bu düşüncelerle oluşturulan bu araştırmada haber metinlerinin dilsel, dilbilgisel ve metinsel özellikleri irdelenecek, Türkçe öğretiminde haber metinlerine ne kadar yer verildiği sorgulanacak ve bu metinlerin yapısal özellikleri temel alınarak öğrencilerin iletişim becerilerini geliştirmek için etkinlik modelleri sunulacaktır.
İkili Gri Kurt ve İkili Harris Şahin Optimizasyonları ile Web Haber Sayfalarının Sınıflandırılması
European Journal of Science and Technology, 2021
Öz İnternetin hızlı gelişmesi ile başta haber kaynakları, e-ticaret ve sosyal ağ uygulamaları olmak üzere çok sayıda web hizmeti ve sayfaları kullanıma sunuldu. Bu uygulamaların kullanımı ile inanılmaz büyüklükte video, ses ve metin gibi içerikler oluştu. Oluşan bu verilerin doğru olarak sınıflandırılması, web uygulamasından faydalanan kullanıcıların istedikleri verilere daha hızlı ve kolay erişmesini sağlar. Çok sayıda öznitelikten oluşan bu veriler metin sınıflandırması için yüksek hesaplama sürelerine neden olur. Yüksek boyutlara sahip veriler için daha az öznitelik ve düşük hesaplama süresi ile yüksek doğrulukta metin sınıflandırma başarısını öznitelik seçimi metotları kullanımı ile sağlamak mümkündür. Literatürde metin sınıflandırmasında kullanılan öznitelik seçim metotları filtreleme, sarma, gömülü ve hibrit yöntemler olarak sınıflandırılmaktadır. Bu çalışmada, metin sınıflandırılmasında öznitelik seçimi için İkili Gri Kurt Optimizasyonu (IGKO) ve İkili Harris Şahin Optimizasyonu (IHSO) algoritmaları ReliefF ile beraber kullanılmıştır. Çalışmada algoritmaların sonuçlarını değerlendirmek için 2 farklı özelliğe sahip veri kümesi kullanılmıştır. Birincisi,100 web belgesinden oluşan 2 kategoriye sahip bir veri kümesi, ikincisi ise 9 kategoriden oluşan (fizik, biyoloji, genetik vs) bilim haberleriyle ilgili web sayfalarından çıkarılan 450 web belgesini içeren veri kümesidir. Sonuçlara göre, IHSO amaç fonksiyonu ve öznitelik sayısına göre karşılaştırma yapılan diğer öznitelik seçim metotlarından daha performanslı olduğu görülmüştür.
NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması
Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 2020
In this study, the classification of news texts according to the relevant age groups was achieved by natural language processing method. A dictionary is constructed in order to use for classification. During the creation of the dictionary, tokenization, morphology, and remove stop word operations is applied to the news, respectively. Figure A. Dictionary stages Purpose: The purpose of this study is to help news sites' make a classification to prevent both neglecting the ethical elements of the news (sexuality, swearing, rape etc.) and being accessable by every age group. Especially in order to prevent the children from being harmed by the content published in moral and psychological terms, and not to be encouraging, the news appropriate for age groups should be readable. Theory and Methods: Zemberek Library was used for Natural Language operations of Turkish news texts. Childhood, Youth and Adult age groups were determined by using Havighurst's Development Theory. A data set has been created using real Turkish web sites' news about the age groups. Data set divided into training and test parts. The training news was used to create a dictionary. Test news was tested applying the proposed model on the created dictionary. Results: The developed dictionary (excluding verb) was applied to the test news and the highest success was determined in the Adult age group. The overall success of the dictionary was found to be 70% correct. Conclusion: In this study, a dictionary is proposed to determine the age groups of the news. While creating the dictionary, Natural Language processing operations were carried out using the Zemberek Library on the data set containing the news. Then, the frequency of the term was calculated for each word in the news (except verb) and the words that were found meaningful in the relevant age groups; age group information is included in the dictionary with the number of times seen in the news. The dictionary developed was tested and 70 percent accuracy was achieved.
Haber Toplama ve Yazma Tekniği Konusunda Alınan Eğitimin Haberlere Yansıması: Aydın Yerel Basını Özelinde Yapılan Çalışma, 2016
Kamu adına hareket eden ve yaşananlardan haberdar olabilmek için ihtiyaçtan ortaya çıkmış olan basın, yüzyıllardır insan yaşamında kritik bir yer edinmiştir. Ekonomik alanda, politik alanda ve toplumların sosyo-psikolojileri üzerinde tesir yaratabilecek özelliğe sahip olan kitle haberleşme araçları kimi zaman kamuyu doğru yönlendirmiş kimi zaman ise muhtelif politik grupların ve sermaye gruplarının denetiminde, kabul görülmeyecek bir biçimde hatalı bir yöne sürüklemeye çalışmıştır. Bu biçimde kullanılmaya açık olan kitle haberleşme araçları insanların, toplumların ve ülkelerin kaderinde kritik rol oynamıştır. Toplumsal kaygı sebebiyle, insanlar için kimi zamanlardaki yokluğu veya eksikliği hissedilen kitle haberleşme araçları zaman zaman aranılan bir görünüm arz etmiştir. Bu kitle haberleşme araçlarından biri olan gazetelerimizin Anadolu'daki yöresel yayınları, yerel basının Türk basın tarihi kitaplarına alınmasını sağlamıştır. Yerel yönetimler ve yerinden yönetim birimlerinin denetlenmesi, bölgesel sorunların ve yerel taleplerin kamuoyunda tartışılmasını sağlaması açısından yerel gazetelerin bilgilendirme ve yerel alternatif gündemler oluşturma işlevleri önemsenmektedir. Gazete içeriklerinin yaygın basında haber ajansları ve ulusal önem sırasına göre belirlenmesi yerel talep ve sorunların kendilerine gazete içeriklerinde yer bulamamalarına neden olmaktadır. Bu eksikliğin giderilmesi yerel veya bölgesel sorun, talep ve gündemlerin okuyucu kitlesine taşınması yerel basın kuruluşları kanalıyla
Adıyaman Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 2018
Okuma eğitiminin temel amacı, okumayı bir süreç olarak kabul edip yöneten, bu süreçte okuduğu metnin yapısal ve içerik özelliklerinin farkında olan etkin ve eleştirel okurlar yetiştirmektir. Her metin türü yapısal ve içerik özellikleri bağlamında ayrı okuma yöntemi gerektirir. Bunun için öğrencilerin, metin türüne göre düzenlenmiş üstbilişsel okuma stratejileri ve okuma yöntem-tekniklerini kullanabilecekleri etkinliklerle ihtiyaçları vardır. Araştırmada 8. sınıf Türkçe ders kitaplarında yer alan okuma etkinliklerinin metin türüne uygun üstbilişsel okuma stratejileri ile okuma yöntem-teknikleri bağlamında değerlendirilmesi amaçlanmıştır. MEB ve Dörtel Yayınevlerinin öğretmen kılavuz kitaplarındaki okuma etkinlikleri incelenmiş ve söz konusu kitaplarda yer alan okuma etkinlikleri betimsel analiz yoluyla çözümlenmiştir. Çalışmada her metin türünde aynı okuma stratejilerinin kullanıldığı kullanıldığı, metin türüne özgü okuma yöntem-teknikleri ile üstbilişsel okuma stratejilerinin işletilmediği sonucuna ulaşılmıştır. Anahtar Kelimeler: Metin türü, üstbilişsel okuma stratejileri, okuma yöntem-teknikleri, Türkçe ders kitapları.