Apa itu Machine Learning: Supervised, Unsupervised, dan Semi Supervised Learning

Apa itu Machine Learning: Supervised, Unsupervised, dan Semi Supervised Learning
Apa itu Machine Learning: Supervised, Unsupervised, dan Semi Supervised Learning

Di Googling - Kita telah melihat beberapa terminologi yang banyak digunakan untuk menggambarkan konsep artificial intelligence (AI) - khususnya Machine Learning (ML). ML adalah sub-bidang AI yang memberikan suatukemampuan untuk belajar dan meningkatkan secara otomatis dari pengalaman tanpa diprogram secara eksplisit.

Untuk proses pembelajaran (pencocokan model) kita perlu menyediakan beberapa pengamatan atau data (juga dikenal sebagai sampel atau contoh) untuk mengeksplorasi pola dasar potensial yang tersembunyi dalam data. Ada tiga jenis pembelajaran utama di bidang Machine Learning yaitu: Supervised, Unsupervised, dan Semi-Supervised Learning.

Seperti ini, kombinasi antara hardware dan kumpulan data dapat melakukan prediksi yang kuat. Dalam machine learning, prediksi ini masuk ke dalam algoritma supervised learning. Supervised learning bekerja dengan kumpulan data berlabel untuk melatih sebuah algoritma untuk mengklasifikasikan data, memprediksi hasil, dan lain sebagainya. Namun, untuk mengatasi data yang tidak berlabel, kita bisa menggunakan algoritma unsupervised learning ataupun mungkin semi-supervised learning yaitu antara supervised dan unsupervised.

Apa itu Supervised Learning

        Supervised learning adalah jenis yang paling umum digunakan dalam dunia industri dan mengacu kepada data yang memiliki keluaran berlabel. Dalam istilah sederhananya, ini berarti bahwa dataset kita memiliki outputnya sudah diketahui. Oleh karena itu, tujuan supervised learning adalah untuk menyesuaikan model terbaik dengan satu set input dan output yang diketahui dalam data yang diberikan.

Mengapa Supervised learning?

  1. Supervised learning memungkinkan Anda mengumpulkan data atau menghasilkan keluaran data dari pengalaman sebelumnya.
  2. Membantu Anda mengoptimalkan kriteria kinerja menggunakan pengalaman.
  3. Supervised machine learning membantu Anda memecahkan berbagai jenis masalah komputasi.

Bagaimana Supervised learning bekerja?

        Misalnya, Anda ingin melatih mesin untuk membantu Anda memprediksi berapa lama waktu yang Anda perlukan untuk berkendara pulang dari tempat kerja Anda. Di sini, Anda mulai dengan membuat satu set data berlabel. Data ini termasuk

  • Kondisi cuaca
  • Waktu
  • Tujuan
  • Rute yang dipilih

Semua detail ini adalah input. Outputnya adalah jumlah waktu yang dibutuhkan untuk pulang ke rumah pada hari tertentu. Anda secara refleks tahu bahwa jika hujan di luar, maka Anda akan membutuhkan waktu lebih lama untuk berkendara pulang. Tetapi mesin membutuhkan data dan statistik.
Mari kita lihat sekarang bagaimana Anda dapat mengembangkan model unsupervised learning dari contoh ini yang membantu pengguna menentukan waktu perjalanan. Hal pertama yang Anda perlukan untuk membuat adalah kumpulan data pelatihan. Set pelatihan ini akan berisi total waktu perjalanan dan faktor terkait seperti cuaca, waktu, dll. Berdasarkan set pelatihan ini, mesin Anda mungkin melihat ada hubungan langsung antara jumlah hujan dan waktu yang anda perlukan untuk pulang.

Jadi, dipastikan semakin banyak hujan, semakin lama Anda akan berkendara untuk kembali ke rumah. Mungkin juga melihat hubungan antara waktu Anda meninggalkan pekerjaan dan waktu Anda akan berada di jalan. Hubungan apakah hujan memengaruhi cara orang mengemudi. Itu juga mulai terlihat bahwa lebih banyak orang bepergian selama waktu tertentu dalam sehari, sehingga semakin lama waktu yang dibutuhkan untuk pulang. Mesin Anda mungkin menemukan beberapa hubungan dengan data berlabel Anda.

Ada dua jenis yang berkaitan dengan Supervised learning: Classification dan Regression.

1. Classification

        Mengambil contoh gambar di bawah ini, gambar bentuk adalah input ke model machine learning, dan pelabelan gambar tersebut sebagai nama-bentuk (Proses ini disebut anotasi) adalah data output. Berdasarkan data input dan output tersebut, model belajar untuk memprediksi kategori data gambar yang tidak terlihat, apakah itu persegi panjang, lingkaran, segitiga, atau segi enam.

Classification digoogling.com

2. Regression

        Mengambil contoh gambar di bawah ini, ada pengalaman (dalam tahun) pada sumbu X. Untuk setiap pengalaman, ada satu gaji (dalam rupiah per bulan) pada sumbu Y. Titik-titik hijau adalah koordinat (X, Y) berupa data Input dan Output. Masalah regresi mencoba mencari fungsi pemetaan kontinu dari variabel input ke output.

Pada gambar di bawah, jika urutan fungsi pemetaan tetap ke 1, yang merupakan fungsi linier, model akan mempelajari garis hitam yang ditunjukkan pada gambar.

Regression digoogling.com

Beberapa kasus penggunaan Supervised Learning yang terkenal adalah:

  • Object detection dan Classification
  • Recommendation
  • Time Series prediction.

Beberapa algoritma yang sering digunakan dalam Supervised Learning :

  • Linear dan Logistic Regression
  • SVM (Support Vector Machines)
  • Random Forest

Unsupervised Learning

        Dalam unsupervised learning, data tidak memiliki keluaran berlabel. Dalam hal ini, ketika mencoba menemukan pola dan struktur dalam data tanpa label atau karakterisasi yang melekat dan tidak ada "jawaban yang benar." Seperti halnya supervised learning.

Mengapa unsupervised learning?

        Berikut adalah alasan utama untuk menggunakan unsupervised learning:

  1. Unsupervised learning dapat menemukan semua jenis pola yang tidak diketahui dalam data.
  2. Metode unsupervised learning membantu menemukan fitur yang dapat berguna dalam kategorisasi.
  3. Lebih mudah untuk mendapatkan data yang tidak berlabel dari komputer dari pada data berlabel, yang membutuhkan intervensi manual.

Bagaimana unsupervised learning bekerja?

        Mari kita ambil kasus bayi dan anjing peliharaan keluarganya. bayi ini akan tahu dan mengidentifikasi anjing tersebut. Beberapa minggu kemudian seorang membawa seekor anjing lain dan mencoba bermain dengan bayi tersebut.

Baby belum pernah melihat anjing ini sebelumnya. Tapi ia mengenali banyak fitur dengan (2 telinga, mata, berjalan dengan 4 kaki) seperti anjing peliharaannya. Sehingga dia dapat mengidentifikasi hewan baru tersebut seperti anjing. Ini adalah Unsupervised learning, di mana Anda tidak diajarkan tetapi belajar dari data (dalam hal ini data tentang seekor anjing.) Jika dalam kasus Supervised learning, seseorang yang membawa anjing tersebut akan memberi tahu bayi itu bahwa itu adalah seekor anjing.

Pembelajaran unsupervised learning dapat dibagi menjadi dua kategori: Clustering dan Association.

1. Clustering

       Mengambil contoh gambar di bawah ini, kami memiliki data input yang terdiri dari gambar berbagai bentuk. Algoritmea machine learning mencoba menemukan kesamaan di antara gambar yang berbeda berdasarkan nilai piksel warna, ukuran, dan bentuk dan membentuk grup sebagai output di mana instance input serupa berada.

Clustering digoogling.com

Algoritma umum termasuk :

  • Hierarchical clustering
  • K-means clustering
  • Dimensionality reduction algorithms like PCA (Principal Component Analysis) dan SVD (Singular Vector Decomposition).

2. Association

        Mengambil contoh gambar di bawah, pembelajaran tersebut lebih pada menemukan aturan yang menggambarkan sebagian besar data. Pelanggan yang membeli pisang juga membeli wortel, atau Pelanggan yang membeli rumah baru juga membeli perabotan baru.

Association digoogling.com

Beberapa kasus penggunaan Unsupervised Learning yang terkenal adalah :

  • Market Segmentation.
  • Fraud detection.
  • Image Segmentation.

Beberapa algoritma yang sering digunakan dalam Unsupervised Learning :

  • K-means.
  • Apriori Algorithm for learning association rule.

Semi-Supervised Learning

        Ini juga merupakan salah satu jenis pembelajaran lain yang menggabungkan Supervised Leaning dan Unsupervised Leaning yang disebut Semi-Supervised Learning. Ini diterapkan ketika di mana  memiliki data input, dan hanya beberapa dari data input tersebut yang diberi label sebagai output.

Bagaimana Semi-Supervised Learning bekerja?

        Mari kita ambil satu contoh, misalkan ada ember yang terdiri dari tiga buah, apel, pisang, dan jeruk. Seseorang menangkap gambar ketiganya tetapi hanya memberi label gambar oranye dan pisang.

Semi-Supervised Learning digoogling.com

Saat ini, telah menjadi tren untuk mengambil sejumlah besar data. Banyak perusahaan besar telah mengumpulkan jutaan GB data dan masih mengumpulkan. Tetapi pelabelan data yang dikumpulkan membutuhkan tenaga kerja dan sumber daya, dan karenanya terlalu mahal. Dan inilah alasan utama mengapa banyak database kehidupan nyata termasuk dalam kategori ini.

Beberapa kasus penggunaan Semi-supervised Learning yang terkenal adalah:

Dalam jenis pembelajaran seperti itu, seseorang dapat menggunakan keduanya.

Supervised learning pada data tak berlabel dan menggunakan keluaran yang diprediksi sebagai masukan untuk melatih kembali model Supervised learning lainnya dan mengujinya pada data tak berlabel lainnya.

Semi-Supervised Learning digoogling.com

Misalnya, ada sebagian besar data pada gambar di atas, dan sejumlah kecil dataset berlabel ada. Kita dapat melatih model menggunakan sejumlah kecil data berlabel dan kemudian memprediksi pada kumpulan data yang tidak berlabel. Prediksi pada dataset yang tidak berlabel akan melampirkan label dengan setiap sampel data dengan sedikit akurasi, yang disebut sebagai dataset berlabel Pseudo. Sekarang model baru dapat dilatih dengan campuran dataset berlabel benar dan dataset berlabel semua. Atau, pembelajaran tanpa pengawasan untuk menangkap dan mempelajari struktur yang ada dalam data.

       Dalam artikel ini kami telah menjelaskan Apa itu Machine Learning: Perbedaa Supervised, Unsupervised, dan Semi-Supervised Learning. Semoga artikel digoogling.com ini dapat bermanfaat dan trimakasih.