Information Retrieval: Preprocessing dengan PHP+MySQL

Tulisan sebelumnya memperlihatkan langkah-langkah preprocessing menggunakan PHP dimana daftar stop word dan term stem disimpan di dalam array. Kali ini, sebagaimana tutorial kuliah IR kemarin malam, saya sertakan kode program, masih dengan PHP dimana teks yang akan diproses dan daftar term stem tersebut dimasukkan ke dalam database MySQL bernama dbstbi yang di dalamnya terdapat 3 tabel, yaitu tbberita, tbstem dan tbindex. Sementara, tbindex tidak digunakan, kali ini.

Continue reading

Advertisements

Information Retrieval: PreProcessing dengan PHP

Preprocessing merupakan tahapan sangat penting dalam fase indexing pada suatu sistem temu-balik informasi (Information Retrieval). Kode program berikut memperlihatkan langkah-langkah sederhana dalam preprocessing terutama stop word removal dan stemming. Program ditulis dalam PHP sehingga mudah dipahami dan langsung dapat dijalankan (asal di taruh di web server). Daftar stop word dan stem dimasukkan ke dalam suatu array sehingga tidak memerlukan database. Tulisan lain memperlihatkan preprocessing yang melibatkan database MySQL.

Continue reading