Archive

Posts Tagged ‘search engine’

Selayang Pandang Informationn Retrieval

13 October 2017 Leave a comment

Alhamdulillah, dapat undangan untuk menyampai overview mengenai Sistem Temu-Kembali Informasi alias Information Retrieval dari Program Studi Sistem Informasi Universitas Trunojoyo Madura, pas hari Jum’at pula. Bahasan mengenai Temu-Kembali Informasi yang biasanya diajarkan dan diskusikan selama 1 semester (14 tatap muka) yang totalnya 18 pekan, dirangkum untuk Training hanya 2.5 jam, tentu hanya poin-poin yang sangat mendasar saja yang dibahas dan difokuskan untuk Mahasiwa yang belum pernah belajar tentang IR ini.

Slide dari materi Training ini sudah dapat didownload. Begitu pula dengan file Spreadsheet yang berisi contoh perhitungan kemiripan kosinus antara Query dengan Daftar dokumen.

Semoga bermanfaat, berkah. Aamiin ๐Ÿ™‚

Advertisements

Focused Web Crawler

30 May 2012 1 comment

Focused Web Crawler merupakan suatuย  web crawler yang bertujuan secara selektif mencari halaman-halaman web yang relevan dengan himpunan topik tertentu yang telah didefinisikan sebelumnya sehingga crawler tidak mencari seluruh web secara mendalam. Focused Crawler memanfaatkan aturan-aturan keputusan berdasarkan pada analisis isi, struktur link dan teks anchor untuk menjaga agar crawler fokus pada topik tertentu, seperti โ€bersepedaโ€ atau โ€HIVโ€. Di sisi lain, web crawler juga dapat difokuskan pada target format dokumen atau non-dokumen tertentu (PDF, Doc, audio dan video).

Read more…

Kemiripan & Klasifikasi Teks – Contoh Perhitungan

11 January 2011 3 comments

Sebagian besar aplikasi web berbasis search engine, information retrieval atau text mining, biasanya melibatkan penanganan query dan klasifikasi dokumen. Penanganan query biasanya menghitung tingkat kemiripan atau relevansi antara query dan daftar dokumen yang tersedia di dalam sistem. Sedangkan klasifikasi adalah pengelompokan dokumen-dokumen ke dalam kelas-kelas yang telah didefinisikan sebelumnya.

Penanganan query dan klasifikasi adalah dua proses yang berbeda, meskipun keduanya dapat menggunakan pendekatan yang beririsan. Perlu dipahami pula, ada perbedaan antara klasifikasi dan clustering, meskipun banyak orang menggunakan 2 istilah ini secara bergantian untuk maksud yang sama. Klasifikasi telah menyiapkan daftar kelas tujuan (pre-defined) sedangkan clustering tidak – hasil clustering dibiarkan membentuk kelas masing-masing. Detailnya tentu dapat dijumpai pada paper yang membahas tentang clustering dan klasifikasi.

Berikut ini adalah 2 file yang berisi:

1. Cosine Similarity. Langkah-langkah praktis menghitung kemiripan antara suatu Query (Q) dengan daftar dokumen (dengan semua dokumen). Kemudian dilakukan pengurutan dan dikembalikan kepada pengguna. Contoh ini memperlihatkan perhitungan kemiripan menggunakan cosine similaity.

Klik dan download!

2. Klasifikasi kNN. Langkah-langkah praktis mengelompokkan suatu dokumen ke dalam salah satu dari 2 kelas tujuan yang pre-defined. Pendekatan yang digunakan adalah kNN. Perhitungan kemiripan digunakan untuk mendapatkan k tetangga terdekat dari dokumen yang akan diklasifikasikan. Nilai k=4 dijadikan default.

Klik dan Download!.

Semoga dua contoh di atas bermanfaat ๐Ÿ™‚

True SE: Web Portal + Search Engine trunojoyo.ac.id

3 January 2011 3 comments

Hampir semua universitas atau perguruan tinggi di Indonesia mempunyai situs, baik untuk level universitas, unit/fakultas, jurusan/program studi sampai dengan laboratorium, dosen, unit kegiatan mahasiswa bahwa blog. Begitu pula pada Universitas Trunojoyo. Makin lama makin banyak informasi yang tersedia pada website-website di bawah domain trunojoyo.ac.id, bukan hanya http://www.trunojoyo.ac.id.

Sayangnya, ada beberapa hal yang sangat menyusahkan pengunjung mendapatkan informasi secara lengkap dan terpadu dari website-website tersebut. Pertama, situs web utama, http://www.trunojoyo.ac.id tidak menyediakan akses ke berbagai situs lain yang berada di bawah domain yang sama. Pengunjung harus mengetahui setiap alamat (URL) yang perlu dikunjungi. Kedua, pengunjung tidak dapat mengetahui dimana saja informasi terkait tersedia. Misalnya beasiswa, jika pada situs web Fakultas Teknik terdapat pengumuman beasiswa XYZ, dimana informasi lebih detail atau terkait tersedia? di Fakultas lain atau di Universitas?

Read more…