Comparison of Gradient Boosting Decision Tree Algorithms for CPU Performance (original) (raw)
Related papers
A Study on Decision Tree Optimization Algorithm
Iğdır Üniversitesi Fen Bilimleri Enstitüsü Dergisi
Bu çalışmanın amacı matematik bölümünde okuyan öğrencilerin, bölümde okutulan analiz derslerindeki türev konusu hakkında nasıl bir tutuma sahip olduklarını karar ağacı optimizasyon algoritması ile ölçmektir. Çalışmada, Kara (2014)’nın geliştirdiği ve Atasoy ve Kara (2021)’nın optimize ettiği 5’li likert ölçeğine sahip türev tutum ölçeği kullanılmıştır. Matematik bölümünde öğrenim gören 194 öğrenciye bu ölçek uygulanmış ve lise düzeyinde pekiştirme derslerine katılan /katılmayan öğrencilerin görüşlerinde farklılık olup olmadığı incelenmiştir. Öğrencilerin ÖSYM matematik testinde doğru cevapladıkları soru sayısına bakıldığında, üniversite analiz dersinde görülen türevlere olumlu baktıkları görülmüştür.
Nesne Sınıflandırma İşlemi İçin Tensor İşleme Birimi ve CPU Performans Karşılaştırması
2020
Tensor Processing Unit (TPU), Google tarafindan derin ogrenme gorevlerini hizlandirmak icin ozel olarak gelistirilmis bir yongadir. Yakin zamana kadar TPU’lar sadece Google Cloud ve Google Colab Platformlari uzerinden kullanilabilmekteydi. 2019 yilinin baslarinda Google firmasi bu urunu Coral adi altinda donanimsal olarak uretmistir. Bu sayede, dizustu bilgisayar ve Raspberry Pi 3 gibi dusuk donanim ozelliklerine sahip cihazlarda derin ogrenme uygulamalari daha hizli bir sekilde gerceklestirilebilmektedir. Bu makalede MobileNet v1 modeli kullanilarak ilk olarak TPU bulunduran Google Coral USB Accelerator ile daha sonra ise CPU kullanilarak 5 kategori ve 4326 cicek fotografindan olusan bir Kaggle veriseti egitilmis ve egitilen bu verisetine dayanarak goruntulerin siniflandirilmasi saglanmistir. Bu yolla cihazin performansi incelenmistir. CPU icin basari orani %84,29252, TPU icin basari orani ise %99,609 olarak elde edilmistir.
European Journal of Science and Technology, 2022
Öz Günümüzde hızla gelişen teknolojiyle verilerin çeşitliliği ve boyutu artmaktadır. Bu artış bilgisayar mimarisinde farklı tasarımları ortaya çıkarmıştır. CPU ve GPU mimarileri üzerlerinde bulunan çekirdek sayıları uygulama anında sonuca ulaşmada çözümler sağlayabilmektedir. Yazılım geliştirmesi yapılırken işlem performansı ve güç tüketimine dikkat edilmelidir. CPU'lar GPU'lardan daha uzun işlem süresi ile uygulamaları yürütmektedir. Bu süre performans sırasında harcanan gücü doğru orantılı etkilemektedir. GPU'lar derin öğrenme algoritmalarında CPU'lardan daha hızlı ve başarılı sonuçlar vermektedir. Öğrenme aşamasındaki en önemli kriter olan veri setinin büyüklüğü ve çeşitliliği öğrenme başarısını aynı oranda artırmaktadır. Bu çalışmada farklı mimariye sahip işlemciler üzerinde veri seti büyüklüğü ve işlem süresi kriterleri göz önünde bulundurularak uygulamalar yapılmıştır. Yapılan uygulamalarda GPU mimarilerinde harcanan güç seviyesi ölçülmüştür. Farklı büyüklüğe sahip 3 veri seti üzerinde CNN, RNN ve LSTM derin öğrenme algoritmaları uygulanmıştır. 6 farklı deney yapılarak performans ve enerji tüketimi konularında tespitler ve performans karşılaştırılması yapılmıştır. Çalışma neticesinde elde edilen sonuçlar ile algoritmalar üzerinde çalışmalar yapılırken süre ve enerji kriterleri baz alınmıştır. Bulgular derin öğrenme algoritmalarının yüksek doğrulukta GPU sistemlerinde tahmin edilmesinde yardımcı bir araç olarak kullanılabileceği yönündedir. Araştırmanın sonuçları CPU ve GPU sistemleri ile enerji ve süre açısından önemli bilgiler içermesinin yanı sıra, gelecekte farklı sektörlerde uygulanması açısından değer taşımaktadır.
Performance Analysis of Decision Tree Algorithms for Breast Cancer Classification
Indian Journal of Science and Technology, 2015
Makine öğrenmesi yöntemlerinin sınıflandırma ve tanımlama açısından başarısının artması, bilgisayar teknolojisine karar verme yeteneği kazandırmış ve analiz yapma metotlarını geliştirmiştir. Makine öğrenmesi yöntemlerinin bu avantajları, medikal alanda hastalıkların teşhis ve tedavi süreçlerinde uzmanlara yardımcı olabilecek gelişmiş karar destek sistemlerini ortaya çıkarmıştır. Kanser teşhisi süreçlerinde kullanımı oldukça yaygınlaşan makine öğrenmesi yöntemleri, sonuç çıkarımında önemli roller üstlenmektedir. Meme kanseri, kadınlar arasında en yüksek ölüm oranına sahip kanser türü olmakla birlikte dünyada görülen en yüksek ikinci kanser türüdür. Hasta sayısı dolayısı ile elde edilen verilerin büyüklüğü göz önünde tutulduğunda, bu verilerin hızlı bir şekilde analizinin yapılması, hastalığın erken teşhisi için önemli bir adımdır. Bu çalışmada, 699 hastadan toplanılmış görüntülerin sayısallaştırılması ile elde edilen 10 adet öznitelik içeren Wisconsin Üniversitesi meme kanseri veri seti, K en yakın komşu ve karar ağacı algoritmalarının çeşitli parametreleri değiştirilerek sınıflandırılması yapılmıştır. Eğitim ve test verileri çapraz doğrulama ile karşılaştırılmış ve en yüksek sınıflandırma başarısı %97,30 ile K en yakın komşu algoritması ile elde edilmiştir.
A CPU Performance Analysis of a Parallel Depth-First Search Algorithm on Peg Solitaire Game
Solo Test oyununu başarıyla tamamlayabilmek için yapılması gereken hamleler, paralel olmayan DFS ve paralel DFS algoritmalarıyla kısa sürelerde bulunabilmektedir. Paralel DFS algoritması uygulamalarında ortaya çıkan problemler, Kuyruk Listesi adı verilen veri yapısıyla çalışma süresi de kısaltılarak çözülebilmektedir. Bu çalışmada, kuyruk listesi veri yapısı kullanıldığında işlemcilerin çalışma ve bekleme zamanları analiz edilerek işlemci performans değerlendirmesi yapılmıştır.
The performance benchmark of decision tree algorithms for spam e-mail detection
The objective of this study is to determine the most convenient decision tree method in terms of accuracy and classification built time by comparing the performance of decision tree algorithms with the purpose of identifying the spam e-mails. The data were gathered from one of the datasets of University of California machine learning datasets including 4601 e-mails for the classification of spam. The spam e-mails were classified utilizing 10 fold cross validation by using WEKA machine learning software involving 12 different decision trees. The performance of this classification was found by implementing the principle component analysis. It was found that the performance of decision trees on determining spam e-mails showed accuracy rate ranging between 91% and 94.68%. Random Forest algorithm was found to be the best classifier with the accuracy rate of 94.68%. It was understood that this algorithm can classify spam e-mails quickly in a hectic e-mail exchange system because the classification built time of the algorithm is 2.11 seconds for the 4601 e-mails.
The Comparison Of Leaf Classification Performance Of Deep Learning Algorithms
DergiPark (Istanbul University), 2018
Bu makalede, bitki yapraklarının sınıflandırılması için kullanılan pek çok yönteme karşı derin öğrenme yoluyla sınıflandırılması yapılarak derin öğrenme algoritmalarının başarımları ortaya konulmuştur. Görüntü işleme yöntemleri ile yapılan sınıflandırma işlemlerinde ön işlem, özellik çıkarımı ve sınıflandırma yöntemi aracılığı ile sonuç alınmaktadır. Derin öğrenme yöntemlerinde yapılan işlemlerde bu gibi işlemlere ihtiyaç duyulmamaktadır. Derin öğrenme yöntemlerinde, ön işlem ve özellik çıkarım gibi aşamalar Konvolüsyonel Sinir Ağları aracılığı ile gerçekleştirilmektedir. Bu çalışmada, yaprak örüntüsü olarak kullanılan veri tabanında, görüntü örnekleri 32 sınıftan oluşan yaklaşık 1900 görüntü vardır. Her bir görüntü sınıfı için ortalama 60 adet görüntü yer almaktadır. Burada yer alan görüntüler yansıma ve tersleme işlemleriyle 4 katına çıkarılmış yaklaşık olarak 7600 görüntü ile işlemler yapılmıştır. Derin öğrenme yöntemlerinden ise AlexNet, Vgg16, Vgg19, ResNet50, GoogleNet gibi derin öğrenme algoritmaları kullanılmış her bir algoritma için yaprak sınıflandırma uygulaması yapılarak, başarımları değerlendirilmiştir.
DNA dizilimlerinin sınıflandırılmasında karar ağacı algoritmalarının karşılaştırılması
DNA dört tip nükleotidden oluşan bir zincir moleküldür. Son yıllarda DNA üzerinde yapılan çalışmalarda, DNA 'daki nükleotid dizilişlerinin birbiri ardı sıra tekrar ettiği görülmüştür. STR olarak adlandırılan ve çeşitli alanlarda kullanılan bu tekrarlar genetik hastalıklarda, adli amaçlı kimlik tespitinde, babalık araştırmaları ve tümör biyokimyasal araştırılmaları gibi birçok farklı amaçlar için kullanılmaktadır. Bu makale çalışmasında, 4 bakteri türünün farklı uzunluklardaki DNA dizilimleri alınarak, bu dizilimlerde tekrar eden nükleotid çiftlerin frekansı bulunmuş ve elde edilen bu frekans değerlerine Karar Ağacı algoritmalarından J48, LMT ve RandomForest uygulanarak bir sınıflandırılma yapılmıştır. Sınıflandırma sonucunda RandomForest algoritmasının, J48 ve LMT algoritmalarından sınıflandırma başarımının çok daha yüksek olduğu görülmüştür.
Nowadays, due to the position of technology, the need for cyber security has increased considerably. The most personal information of people is easily accessible on the internet. Information such as banking information, personal information, state secrets, military secrets need to be protected. Many encryption algorithms have been developed to protect people's personal information and state secrets. In this article, comparison of RSA, AES, DES, algorithms is done.. These comparisons were made considering the speed of the algorithms.
Investigation Of Gpu Use In Programming Computational Based Algorithms
With the development of multi-core technology that requires high processing power of parallel computing approach to accelerate many algorithms have become widely used. Parallel computing is one of the General Purpose GPU Programming method (GPGPU), which offers low cost and high performance has been the preferred approach. Graphics cards for gaming and graphic intensive simulations are designed to make mathematical calculations. Graphics cards, structures and processes in the pipeline due to very seededness not dependent on large amounts of data in parallel has the ability to handle quickly. The development of graphics cards faster than the processor and graphics card acceleration of parallel computing power of the high, the ability to use of GPUs for general purpose programming paved the way. GPGPU technology with the development of many algorithms that require high processing power to accelerate the use of parallel computing approach has become widespread. In the present study, carried out with OpenCL thread of some algorithms that compute-intensive on the CPU and GPU performance analysis was carried out. Experimental results, 2-core CPU (Intel Core 2 Duo T9550), 448x2-core NVIDIA GPU (2 x NVIDIA Tesla M2050) and 1600x2 core ATI GPU (ATI Radeon HD 5970 X2), OpenCL general programming platform technology supporting hardware computers with were obtained using. Calculation results for this purpose with reference to the second core CPU acceleration, performance, power consumption and cost by comparison graphs were obtained. Results approximately compute-intensive algorithms at least 13 times, more than 1001 times the acceleration, advanced password recovery algorithms at least 152 times, more than 905 times the acceleration, 1190 times the performance increase, 119 times more energy saving, 618 times more low cost is obtained.