Implementasi Fulltext Indexing pada Dokumen Elektronik dengan Algoritma B-Tree (original) (raw)
Related papers
IMPLEMENTASI ALGORITMA BRUTE FORCE DALAM PENCARIAN DATA KATALOG BUKU PERPUSTAKAAN
Perpustakaan merupakan salah satu tempat yang banyak digunakan mahasiswa untuk mencari informasi didalam memecahkan suatu masalah yang ditemui pada proses pembelajaran. Dalam pelayanannya pada perpustakaan tidak terlepas dalam satu aktifitas pencarian data. Hal ini disebabkan karena jumlah buku yang terdapat di perpustakaan sudah sangat banyak, sehingga hal ini akan memberikan masalah dalam hal pencarian data katalog buku yang terdapat pada perpustakaan. Dalam melakukan pencarian data katalog buku perpustakaan, pencocokan string merupakan suatu bagian dalam proses pencarian string (string searching). Data katalog buku yang dihasilkan sangat bergantung pada teknik ataupun algoritma yang dilakukan dalam pencocokan string tersebut. Pada penelitian ini algoritma yang digunakan dalam pencocokan string yaitu Brute Force.
Indexing Dan Searching Document Menggunakan Metode Semantic Suffix Tree Clustering Berbasis Android
2017
Anroid smartphone device has been involved in user’s way of living in this modern era. Smartphone device is used in user’s daily activity such as reading and storing electronic document in Pdf, Word and other file formats. User might and frequently forgot elctronic document’s directory in the smartphone. This research aims to help user to find documents that reflect user’s keyword semantically or literally. Documents that reflect user keyword semantically or literaly will be shown. Various method is tested to minimize time use in clustering using suffix tree to semantic searching processes. This research finds that user could find documents in the smartphone that reflect user’s keyword. Average time use for clustering about 100 documents containing 1000 word for each document is 686.7 seconds. User is able to search for document right after clustering process is done. Average time use for document searching is less than 2 seconds. Hence, thread implementation for processes decrease ...
Indexing and Retrieval Engine untuk Dokumen Berbahasa Indonesia dengan Menggunakan Inverted Index
Dokumen teks tergolong dalam data tidak terstruktur. Jika dibandingkan dengan informasi yang tersimpan dalam bentuk yang terstruktur (misalnya pada tabel dalam sebuah database), maka data tidak terstruktur relatif lebih sulit dalam hal pengelolaan, penyimpanan, pencarian ulang maupun pengamanannya. Dalam paper ini dipaparkan sebuah metode indexing dan retrieval yang mampu menyimpan dokumen teks sebagai inverted index yang memiliki berbagai keunggulan penyimpanan data terstruktur. Proses indexing melibatkan beberapa tahap yaitu parsing, stopping, stemming, sorting dan merging. Proses indexing dilakukan terhadap 6464 buah file txt dalam Alquran Terjemahan Indonesia. Setelah itu indeks yang dihasilkan digunakan dalam proses pencarian dokumen yang hasilnya dibandingkan dengan hasil pencarian dokumen konvensional secara full text search. Baik hasil pencarian maupun waktu yang dibutuhkan semuanya dicatat untuk mengukur performa retrieval engine dengan parameter precision, recall dan waktu. Hasil pengujian menunjukkan bahwa proses indexing tidak mengurangi nilai recall, namun menurunkan nilai precision hingga 41,88% demi meningkatkan kecepatan pencarian hingga 3800 kali lipat. Kata kunci : inverted index, indexing and retrieval, precision, recall
ScientiCO : Computer Science and Informatics Journal, 2019
Departement of Information Technology Tadulako University, currently does not have a digital repository system that can accommodate the work of student either in form of paper, research report, and scientific posters at the moment. Various of student works is stored in form of physical archives which is definitely risky to get damaged, lost, difficult to access by other students. The existence of a digital repository system can also be used as a benchmark media to develop student creativity in producing scientific work. Searching mechanism is one of the crucial parts in a repository system. There are several commonly used algorithms such as Depth-First search and Breath-First search. Each algorithm have deficiencies and advantages. Therefore, to optimize the searching mechanism on the proposed digital repository system, the author purpose using the DepthFirst search and Breath-First search hybrid algorithms. The result of this study are the design of a prototipe repository system th...
semanTIK, 2018
Abstrak Dengan semakin berkembangnya teknologi, maka semakin meningkat pula tindak plagiarisme di dunia perkulihaan. Banyak mahasiswa yang melakukan plagiarisme misalnya dalam mengerjakan tugas kuliah dan proposal tugas akhir. Oleh karena itu, dibutuhkan aplikasi yang mampu mendeteksi tingkat kesamaan (similarity) antara dokumen teks. Pada penelitian ini menggunakan algoritma Enhanced Confix Stripping (ECS) Stemmer untuk proses stemming teks dan algoritma Winnowing untuk menghitung tingkat kesamaan (similarity) antar dokumen. Dengan ditentukannya nilai gram dan window pada perhitungan algoritma Winnowing, memudahkan user untuk menggunakan aplikasi tanpa harus bingung untuk menentukan nilai gram dan window-nya untuk menghasilkan nilai similarity yang akurat. Dari hasil pengujian 5 pasang bab 1 tugas akhir mahasiswa yang berkategori sama menghasilkan nilai similarity sekitar 45-20%. Abstract With the development of technology, the increase of acts of plagiarism in the world of education. Many students who did plagiarism in doing their task and thesis as example. Therefore, an application that is able to detect the similarity between text documents is required. This research used Enhanced Confix Stripping (ECS) Stemmer algorithm for text stemming process and Winnowing algorithm to calculate similarity between documents. By specifying the gram and window values of the Winnowing algorithm, it made easier for the user to use the application without being confused to determine the value of the gram and the window to produce an accurate equality value. From the test results 5 pairs of chapters 1 thesis of students who categorized together produced a similarity score of about 45-20%.
JTIM : Jurnal Teknologi Informasi dan Multimedia
The research was conducted to develop a search system undergraduated thesis based on abstract using full-text searching in Library Information Systems Department of Electrical Engineering State University of Jakarta. The feature fulltext search system is developed to facilitate students in finding undergraduate thesis based on abstract. By using the select clause MATCH () ... Against, the data can be searched ordered by relevancy value. The research was conducted in the laboratory of multimedia Department of Electrical Engineering Faculty of Engineering, State University of Jakarta from September 2012 to December 2012. Development cycle of full-text search system conceptually consists of the design and analysis of systems, retrieval system development, integration of full-text search system to test SIPEL SIPEL 2013 and 2013. Full-text search system stores abstract 229 thesis abstract (undergraduate thesis, comprehensive, and TA) using XAMPP web server applications. Library Informati...
Implementasi Metode Document Oriented Index Pruning Pada Information Retrieval System
2016
Perkembangan Informasi yang sangat pesat mengakibatkan jumlah informasi yang tersedia secara online mengalami peningkatan yang sangat pesat, sehingga sangat sulit apabila pencarian dilakukan secara satu-persatu, karenanya dibutuhkan Information Retrieval System untuk menemukan suatu informasi. Permasalahan yang muncul pada Information Retrieval adalah semakin besar data collection yang dimiliki maka semakin besar pula biaya yang dibutuhkan untuk menyediakan layanan komputasi, storage, dan network resource. Oleh karena itu suatu metode diperlukan untuk mengatasi permasalahan tersebut yaitu dengan kompresi index. Metode kompresi index yang akan digunakan adalah metode Document Oriented Index Pruning. Berdasarkan penelitian yang telah dilakukan sampai dengan persentase index sebesar 80% metode Document Oriented Index Pruning mampu memberikan hasil relevansi pencarian yang lebih baik dibandingkan hasil relevansi pencarian tanpa menggunakan metode Document Oriented Index Pruning sehingga...