Penambangan Teks di Python: Preprocessing dengan NLTK

Di dunia saat ini, menurut perkiraan industri, hanya sekitar 20 persen dari data yang dihasilkan dalam format terstruktur saat kita berkomunikasi, seperti melalui tweet yang kita tulis, saat kita mengirim pesan menggunakan WhatsApp, Email, Facebook, Instagram atau pesan teks apa pun. Dan sebagian besar data ini ada dalam bentuk teks yang merupakan format yang sangat tidak terstruktur. Untuk menghasilkan wawasan yang bermakna dari data teks maka kita perlu mengikuti metode yang disebut Analisis Teks.

Penambangan Teks adalah proses memperoleh informasi berkualitas tinggi dari teks. Tujuan keseluruhannya adalah mengubah teks menjadi data untuk dianalisis melalui aplikasi Pengolahan Bahasa Alami (Natural Language Processing, NLP). NLP menggunakan metodologi yang berbeda untuk menguraikan ambiguitas dalam bahasa manusia, termasuk di antaranya adalah peringkasan otomatis (summarization), penandaan bagian-dari-ungkapan (part of speech tagging), disambiguasi, chunking, serta pengenalan dan pemahaman bahasa alami.

Kita akan melihat sebagian besar proses Text Mining tersebut menggunakan Python dan library NLTK.

Struktur Data Probabilistik: Bloom Filter

Struktur data mainstream seperti List, Map, Set, Tree, dll. banyak digunakan untuk mencapai hasil tertentu berkaitan dengan ada atau tidaknya data, mungkin bersama dengan jumlah kemunculannya dan semacamnya. Struktur data probabilistik akan memberikan efisiensi memori, hasil yang lebih cepat, bentuk hasil lebih ke ‘mungkin’ daripada ‘pasti’. Tampaknya tidak intuitif untuk menggunakan struktur data probabilistik untuk saat ini, tetapi tutorial ini akan mencoba meyakinkan bahwa jenis struktur data ini memiliki tempat pemanfaatan khusus dan kita mungkin menemukannya berguna dalam skenario tertentu.

Dalam posting ini, kita akan mendiskusikan tentang salah satu struktur data probabilistik paling populer yang disebut Bloom filter. Silakan Akses Tutorial ini!

Tutorial Hadoop untuk Pemula

Jumlah data telah meningkat pesat dalam satu dekade terakhir. Ini termasuk volume besar dari berbagai format data yang dibangkitkan pada kecepatan sangat tinggi. Pada masa awal, bukanlah tugas yang berat untuk mengelola data, tetapi dengan meningkatnya data, telah menjadi lebih sulit untuk menyimpan, memroses, dan menganalisisnya. Data demikian dikenal sebagai Big Data. Bagaimana kita mengelola big data? Gunakan Hadoop, suatu framework yang dapat digunakan untuk menyimpan (store), memroses dan menganalisis big data.

Dalam tutorial ini kita akan mendiskusikan hal-hal berikut:

1. Mengapa Hadoop?
2. Apa itu Hadoop?
3. Hadoop HDFS
4. Hadoop MapReduce
5. Hadoop YARN
6. Kasus penggunaan Hadoop
7. Demo HDFS, MapReduce, dan YARN

Berminat? silakan download tutorial ilustratif ini, hanya 18 halaman koq 🙂

Hadoop MapReduce, Bagaimana Kerjanya?

MapReduce adalah suatu software framework dan programming model yang digunakan untuk pemrosesan jumlah data yang besar. Program MapReduce bekerja dalam dua fase, yaitu Map dan Reduce. Tugas Map berurusan dengan splitting dan mapping dari data sedangkan tugas Reduce melakukan shuffle dan reduce terhadap data.

Hadoop mampu menjalankan program MapReduce yang ditulis dalam berbagai bahasa: Java, Ruby, Python, dan C++. Program MapReduce sifatnya parallel, jadi sangat berguna bagi  pelaksanaan analisis data skala besar menggunakan banyak mesin di dalam cluster.

Inputan atau masukan untuk setiap fase adalah pasangan key-value. Setiap programmer harus menetapkan dua fungsi: fungsi map dan fungsi reduce.

Bagaimana MapReduce ini bekerja? Klik dan Baca Tutotorial yang disadur dari situs web guru99 ini!

Membuat RESTful API dengan PHP dan MySQLi

Tutorial PHP kali ini mencoba untuk menjelaskan secara mudah cara membangun suatu RESTful API yang mendukung semua operasi CRUD tanpa harus menggunakan suatu framework REST. Adanya framework memudahkan banyak urusan tetapi kurang baik untuk memahami cara kerja konsep dasar dari suatu sistem. Kita dapat mendefinisikan struktur dan mengubahnya sesuai dengan keperluan, termasuk mendefinisikan aturan bagi framework REST API dan kemudahan aksesnya. Adalah tidak wajib untuk menggunakan framework untuk membangun REST API menggunakan PHP. Kita dapat membuat API hanya menggunakan kode PHP inti.

Apa beda tutorial ini dengan sebelumnya yang juga membahas pembangunan RESTful API dengan PHP? Jika sebelumnya komunikasi antara PHP dan MySQL menggunakan PDO, maka kali ini hanya menggunakan mysqli. Perlu diingat kembali bahwa PHP menyediakan dua cara mengakses MySQL, yaitu berorientasi obyek (PDO) dan prosedural (mysqli). Bagaimana dengan mysql? Sudah tidak boleh digunakan!

Penasaran? Klik Download dan lanjutkan…

Setup dan Reset Password Root MySQL pada Linux Ubuntu 18.04 Bionic Beaver

Tutorial ini bertujuan untuk memperlihatkan cara mensetup dari awal atau mereset password bagi pengguga root dari server basis data MySQL versi 5.7 yang berjalan pada Linux Ubuntu 18.04 (Bionic Beaver). Sebagaimana diketahui, mulai Ubuntu 18.04, instalasi MySQL dan MariaDB server tidak dituntaskan oleh installer mysql-server (via apt install mysql-server) dengan penentuan password root. Kita harus melakukannya secara manual menggunakan perintah mysql_secure_installation. Namun, pada beberapa kasus (termasuk di Elementary 5 dan Ubuntu 18.04.2 yang saya gunakan), pendekatan ini tidak berhasil.

Selain untuk membuat password baru bagi pengguna root (karena lupa misalnya), panduan ini juga dapat digunakan untuk menuntaskan Instalasi MyQL Server dan MariaDB tersebut, termasuk pada distribusi Linux berbasis Debian dan Ubuntu seperti Elementary dan Linux Mint.

Silakan download, baca, praktekkan dan semoga masalah terkait instalasi MySQL server dan “lupa” password root tuntas…tas… tas. Aamiin.

Mengenal Blockchain: Teknologi di Belakang Bitcoin

Dalam bahasa yang sederhana, Blockchain dapat didefinisikan sebagai suatu rantai blok (chain of the block) yang mengandung informasi. Teknik ini digunakan untuk mentimestamp dokumen digital sehingga tidak mungkin untuk membackdate atau merubahnya.

Blockchain digunakan untuk mengamankan transfer item-item seperti uang, properti, kontrak, tanpa memerlukan perantara pihak ketiga seperti Bank atau Pemerintah. Begitu data direkam ke dalam suatu blockchain, maka sudah sangat sulit untuk mengubahnya.

Blockchain merupakan suatu protokol software (seperti SMTP untuk email). Namun, Blockchains tidak dapat berjalan tanpa Internet. Disebut pula meta-technology karena ia mempengaruhi teknologi lain. Blockchain tersusun dari beberapa bagian: database, aplikasi software, beberapa komputer yang terkoneksi, dll.

Beberapa kali diistilahkan sebagai Bitcoin Blockchain atau Ethereum Blockchain dan kadang-kadang mata uang virtual atau token digital lainnnya. Namun, sebagian besarnya berbicara mengenai buku besar terdistribusi (distributed ledgers).

Dalam tutorial ini, kita akan mempelajari:

• Apa itu Blockchain?
• Bukan Blockchain!
• Arsitektur Blockchain
• Bagaimana Transaksi Blockchain Bekerja?
• Mengapa kita membutuhkan Blockchain?
• Versi Blockchain
• Varian Blockchain
• Kasus Penggunaan Blockchain
• Kasus Penggunaan Nyata dari Blockchain
• Bitcoin cryptocurrency: Aplikasi Blockchain Paling Populer
• Blockchain vs. Basis Data Bersama
• Mitos tentang Blockchain
• Keterbatasan teknologi Blockchain

Silakan download dan baca Tutorialnya. In syaa Allah dapat dituntaskan dalam 10 menit. Aamin.