SUPERVISED LEARNING : MENGENAL CARA KERJA NAIVE BAIYES

 

ALGORITMA NAIVE BAYES

A. Pengertian Naive Bayes

        Naïve Bayes Classifier merupakan sebuah metoda klasifikasi yang berakar pada teorema Bayes . Metode pengklasifikasian dg menggunakan metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas Bayes , yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes . Ciri utama dr Naïve Bayes Classifier ini adalah asumsi yg sangat kuat (naïf) akan independensi dari masing-masing kondisi / kejadian.
     Menurut Olson Delen (2008) menjelaskan Naïve Bayes unt setiap kelas keputusan, menghitung probabilitas dg syarat bahwa kelas keputusan adalah benar, mengingat vektor informasi obyek. Algoritma ini mengasumsikan bahwa atribut obyek adalah independen. Probabilitas yang terlibat dalam memproduksi perkiraan akhir dihitung sebagai jumlah frekuensi dr ” master ” tabel keputusan.
        Naive Bayes Classifier bekerja sangat baik dibanding dengan model classifier lainnya. Hal ini dibuktikan oleh Xhemali , Hinde Stone dalam jurnalnya “Naïve Bayes vs. Decision Trees vs. Neural Networks in the Classification of Training Web Pages” mengatakan bahwa “Naïve Bayes Classifier memiliki tingkat akurasi yg lebih baik dibandingmodel classifier lainnya”.

Gambar 1. Naive Bayes
        Keuntungan penggunan adalah bahwa metoda ini hanya membutuhkan jumlah data pelatihan ( training data ) yg kecil unt menentukan estimasi parameter yg diperlukan dalam proses pengklasifikasian. Karena yg diasumsikan sebagai variable independent, maka hanya varians dr suatu variable dalam sebuah kelas yg dibutuhkan unt menentukan klasifikasi, bukan keseluruhan dr matriks kovarians.

B. Manfaat Naive Bayes

1. Kegunaan Naïve Bayes

  • Mengklasifikasikan dokumen teks seperti teks berita ataupun teks akademis
  • Sebagai metode machine learning yang menggunakan probabilitas
  • Untuk membuat diagnosis medis secara otomatis
  • Mendeteksi atau menyaring spam

2. Kelebihan Naïve Bayes

  • Bisa dipakai untuk data kuantitatif maupun kualitatif
  • Tidak memerlukan jumlah data yang banyak
  • Tidak perlu melakukan data training yang banyak
  • Jika ada nilai yang hilang, maka bisa diabaikan dalam perhitungan.
  • Perhitungannya cepat dan efisien
  • Mudah dipahami
  • Mudah dibuat
  • Pengklasifikasian dokumen bisa dipersonalisasi, disesuaikan dengan kebutuhan setiap orang
  • Jika digunakan dalaam bahasa pemrograman, code-nya sederhana
  • Bisa digunakan untuk klasifikasi masalah biner ataupun multiclass

3. Kekurangan Naïve Bayes

  • Apabila probabilitas kondisionalnya bernilai nol, maka probabilitas prediksi juga akan bernilai nol
  • Asumsi bahwa masing-masing variabel independen membuat berkurangnya akurasi, karena biasanya ada korelasi antara variabel yang satu dengan variabel yang lain
  • Keakuratannya tidak bisa diukur menggunakan satu probabilitas saja. Butuh bukti-bukti lain untuk membuktikannya.
  • Untuk membuat keputusan, diperlukan pengetahuan awal atau pengetahuan mengenai masa sebelumnya. Keberhasilannya sangat bergantung pada pengetahuan awal tersebut Banyak celah yang bisa mengurangi efektivitasnya
  • Dirancang untuk mendeteksi kata-kata saja, tidak bisa berupa gambar
  • C. Pemodelan dengan Naive Bayes
  •     Library Python, Scikit learn adalah library paling berguna yang membantu kami membangun Naive Bayes model dengan Python. Kami memiliki tiga jenis model Naive Bayes berikut di bawah Scikit pelajari library Python:

  • a. Gaussian Naive Bayes

  •     Ini adalah pengklasifikasi Naive Bayes paling sederhana yang memiliki asumsi bahwa data dari masing-masing label diambil dari distribusi Gaussian sederhana.

  • b. Multinomial Naive Bayes

  •     Pengklasifikasi Naive Bayes lain yang berguna adalah Multinomial Naive Bayes di mana fitur-fiturnya adalah diasumsikan diambil dari distribusi Multinomial sederhana. Naive Bayes semacam itu adalah paling sesuai untuk fitur yang mewakili jumlah diskrit.

  • c. Bernoulli Naive Bayes

  •     Model penting lainnya adalah Bernoulli Naive Bayes di mana fitur diasumsikan biner (0s dan 1s). Klasifikasi teks dengan model 'bag of words' dapat menjadi aplikasi dari Bernoulli Naive Bayes.

  • D.  Aplikasi Naive Bayes
  • Berikut ini adalah beberapa aplikasi umum dari klasifikasi Naive Bayes:

  • Prediksi real-time: Karena kemudahan implementasi dan komputasi yang cepat, ini dapat menjadi digunakan untuk melakukan prediksi secara real-time.

  • Prediksi multi-kelas: Algoritma klasifikasi Naive Bayes dapat digunakan untuk memprediksi probabilitas posterior dari beberapa kelas variabel target.

  • Klasifikasi teks: Karena fitur prediksi multi-kelas, Naive Bayes algoritma klasifikasi sangat cocok untuk klasifikasi teks. Itu sebabnya itu juga digunakan untuk memecahkan masalah seperti penyaringan spam dan analisis sentimen.

  • Sistem rekomendasi: Seiring dengan algoritma seperti pemfilteran kolaboratif, Naive

  • Bayes membuat sistem Rekomendasi yang dapat digunakan untuk menyaring informasi yang tidak terlihat dan untuk memprediksi cuaca pengguna akan menyukai sumber daya yang diberikan atau tidak.

  • E.  Contoh Penyelesaian Naive Bayes
  •         Contoh perhitungan metode naive bayes untuk sistem pakar penentuan kerusakan pada laptop, pada tahap awal kita harus mempunyai data kerusakan dan gejala laptop terlebih dahulu. Kerusakan laptop yang dibahas disini adalah tentang kerusakan dibagian hardware didalam laptop. Berikut adalah data yang disajikan.

  • 1. Data kerusakan laptop :
  • K1 = IC Charger Rusak

 

  •