Archive

Posts Tagged ‘data mining’

Selayang Pandang Information Retrieval

13 October 2017 Leave a comment

Alhamdulillah, dapat undangan untuk menyampai overview mengenai Sistem Temu-Kembali Informasi alias Information Retrieval dari Program Studi Sistem Informasi Universitas Trunojoyo Madura, pas hari Jum’at pula. Bahasan mengenai Temu-Kembali Informasi yang biasanya diajarkan dan diskusikan selama 1 semester (14 tatap muka) yang totalnya 18 pekan, dirangkum untuk Training hanya 2.5 jam, tentu hanya poin-poin yang sangat mendasar saja yang dibahas dan difokuskan untuk Mahasiwa yang belum pernah belajar tentang IR ini.

Slide dari materi Training ini sudah dapat didownload. Begitu pula dengan file Spreadsheet yang berisi contoh perhitungan kemiripan kosinus antara Query dengan Daftar dokumen.

Semoga bermanfaat, berkah. Aamiin 🙂

Advertisements

Ilustrasi Preprocessing & Searching Dalam Text Mining

1 November 2011 Leave a comment

Bidang Text Mining atau Information Retrieval semakin maju dan banyak digunakan. Dua tugas penting dalam bidang ini adalah PreProcessing dan Searching. Kualitas Dokumen yang dikembalikan ke pengguna oleh suatu Search Engine sangat tergantung pada kualitas fitur yang dihasilkan pada tahapan Preprocessing dan kemampuan pendekatan perankingngan yang dipakai saat pencarian atau perhitungan kemiripan.

Kali ini, kami coba memberikan sebuah contoh ilustratif bagaimana preprocessing dilakukan. Kemudian, jika terdapat suatu query, bagaimana query ini diperlakukan dan kemudian dihitung kemiripannya dengan daftar dokumen yang tersedia.

Klik link berikut dan nikmati file PDF-nya 😉

Unified Messaging System Information Retrieval & Klasifikasi Teks

22 January 2010 2 comments

Tulisan ini menjelaskan konsep dasar yang berkaitan erat dengan penelitian saya mengenai content server pada suatu Unified Messaging System (UMS). Sebagai gambaran, content server yang sedang dikembangkan mengelola content iklan baris yang mempunyai sifat unik dan tidak terstruktur. Content server ini menerima query atau pesan teks dari pengguna UMS (dalam hal ini adalah UMS NoteBOX di Laboratorium Sistem Tersebar, Informatika, STEI ITB, Bandung) dan web. Query yang diterima oleh server diproses untuk mendapatkan jawaban yang tepat (dengan nilai presisi dan recall tinggi), kemudian jawaban tersebut
dikembalikan kepada pengguna atau diforward ke suatu alamat email, sms atau fax. Pesan dari pengguna juga dapat ditambahkan sebagai content baru, memperkaya sistem content dengan melibatkan pengguna secara aktif, sehingga tidak selalu bergantung pada pengelola content. Konsep yang dibahas mencakup sekilas tentang UMS NoteBOX dan iklan baris, information retrieval (IR) dan klasifikasi dokumen teks. Referensi yang dicantumkan diakhir tulisan dapat memberikan penjelasan yang panjang x lebar x tinggi = volume mengenai konsep yang disampaikan di sini 🙂

Detailnya silakan klik di sini.

Algoritma Clustering K-Means

14 November 2008 Comments off

Clustering merupakan suatu teknik data mining yang membagi-bagikan data ke dalam beberapa kelompok (grup atau cluster atau segmen) yang tiap cluster dapat ditempati beberapa anggota bersama-sama. Setiap obyek dilewatan ke grup yang paling mirip dengannya. Ini menyerupai menyusunan binatang dan tumbuhan ke dalam keluarga – keluarga yang para anggotanya mempunyai kemiripan.

Read more…