Overview
maksud postingan ini dibuat adalah untuk memberikan gambaran kepada kalian bagaimana sebenarnya machine learning bekerja menggunakan bahasa Python. Tenang, kita takkan membahasa hingga paling mendalam sampai kalian pusing. Tutorial dibawah akan sangat mudah.
Apa Itu Machine Learning?
Machine Learning adalah sebuah teknik atau cara kita melatih mesin untuk menyelesaikan permasalahan yang kita inginkan. Perbedaannya adalah terkadang data yang ingin diproses oleh machine learning adalah sebuah data abstrak yang membutuhkan waktu yang lama untuk diproses oleh algoritma biasa.Bayangkan, jika setiap hari kalian mendapatkan kiriman spam tidak penting ke kontak masuk email kalian. Pasti kalian kesal kan? Maka kalian akan sulit sekali menghapus dan memilih email mana yang spam dan tidak. Maka dari itu kalian terkadang menerapkan fitur spam filter. Dan spam filter menerapkan konsep machine learning untuk menyaring email yang tidak penting.
Spam filter akan meminta paramter untuk menentukan apakah sebuah email adalah spam atau bukan. Biasanya dengan cara mendeteksi kata katanya. Atau bahkan tergantung siapakh pengirim email tersebut
Setelah itu kita menulis algoritma untuk membentuk pola yang akan menandai manakah email yang benar benar spam.
Dan akhirnya model machine learning kita siap untuk diluncurkan
Jika kamu masih bingung seputar machine learning, maka gambar dibawah semoga bisa membantu
sumber: Dicoding |
Bahasa Pemograman Yang Digunakan
Ada banyak sekali bahasa pemograman yang digunakan untuk melatih machine learning, salah satu yang terkenal adalah Python. Karena, Python sudah terintergrasi dengan library Tensorflow. Yaitu, library yang berisi command dan perintah untuk membentuk model machine learning.
Kalian bisa mempelajari bahasa Python di Dicoding.com, yaitu platform kursus pemograman, cloud dan teknologi lainnya. Semuanya dibahas disana secara mendetail kamu akan mengerti bahkan jika kamu belum pernah mencoba pemograman sebelumnya
Menentukan Model
Model yang sangat cocok dipelajari oleh pemula adalah Linear Regression
Linear regression is a basic and commonly used type of predictive analysis. The overall idea of regression is to examine two things: (1) does a set of predictor variables do a good job in predicting an outcome (dependent) variable? (2) Which variables in particular are significant predictors of the outcome variable, and in what way do they–indicated by the magnitude and sign of the beta estimates–impact the outcome variable? These regression estimates are used to explain the relationship between one dependent variable and one or more independent variables
Linear Regression adalah model untuk memprediksi suatu kumpulan data. Contohnya, jika kita mempunya kumpulan data tentang jumlah penjualan mobil dan data bulan bulan penjualan. Maka kita bisa memprediksi rentan bulan mana yang memiliki penjualan tertinggi, sehingga itu akan menjadi pola dasar kapan kita harus lebih optimal dalam menjual produk mobil
Linear Regression adalah model utama yang harus dikuasai oleh para engineer machine learning. Ibaratnya, Linear Regression adalah kata 'hello world'-nya Deep Learning, artinya hal paling sederhana yang harus kalian pelajari
Notebook
Notebook disini adalah kanvas kita untuk membentuk model machine learning menggunakan bahasa Python. Google Colab adalah alat yang terkoneksi dengan cloud untuk mengeksekusi segala perintah pemograman, sehingga kita bisa menggunakannya sebagai tempat untuk menciptakan model learning.
Kalo kalian biasa ngoding di VSCode, maka Google Colab ini ibaratnya VSCode dalam bentuk cloud, tanpa mesin fisik, semuanya terkoneksi di awan. Bedanya setiap eksekusi akan terekam dan tersimpan dalam sebuah cell dan bisa diakses kapan saja selama kita belum menghapusnya
Jika kalian sudah menguasai bahasa pemograman Python, saatnya kita membuat model learning Linear Regression di Google Colab
Install Google Colab di Google Drive kalian. Dengan cara klik New di pojok kanan. Lalu Klik Connect more apps
Lalu Klik Install. Saya sendiri sudah menginstallnya
Lalu klik New, dan klik Google Colaboratory
Disinilah, kita akan beraksi
Klik + Code
Lalu masukkan kodenya disini
Kita breakdown beberapa hal penting dari skrip diatas
numpy adalah sebuah library yang berisi perintah untuk menjalankan -biasanya array dan matriks. Nah, di dalam model ini kita mempresentasikan data data dengan array. Karena lebih mudah diolah
dan matplotlib adalah library python untuk menggambarkan array menjadi bentuk visual akhirnya. Nanti kita akan membahasnya lebih lanjut
Ingat.
[1,1,2,2,3,4,4,5,5,5] adalah kumpulan data jumlah rumah
[15000, 18000, 27000, 34000, 50000, 68000, 65000, 81000,85000, 90000] adalah sekumpulan harga rumah
yang semua itu sudah dibungkus dalam sebuah array dan disimpan dalam variabel. Sehingga mudah untuk diolah oleh fungsi
Pada awalnya, data tersebut bisa saja berbentuk tabel. Berhubung kita akan menciptakan model linear regression sebagai model prediksi. Maka, data data tersebut harus dijadikan sebagai array. Kita akan membahas memproses dataset dengan file csv di postingan yang akan datang
Dalam machine learning, sebenarnya kita hanya memanfaatkan fungsi fungsi yang sudah ada dalam suatu library dan mengatur parameternya menjadi model yang kita inginkan. Sedikit sintaks yang harus kita ingat. Sehingga jauh lebih mudah dibandingkan programming biasa. Tapi, tentu saja semakin rumit model yang kalian buat, maka semakin rumit pula fungsi yang dibutuhkan
Masukkan skrip berikut.
Skrip tersebut akan membentuk pola titik titik berdasarkan data jumlah rumah, dan harga rumah.
kita buat mode linear kita dengan fungsi yang terdapat pada library sklearn
reshape adalah fungsi untuk membersihkan data data yang outlier atau data data yang disitu bisa menimbulkan bias, sehingga bisa menjadikan model linear regression menjadi tidak akurat.
Setelah semuanya selesai. Maka kita masukkan kedua data jumlah rumah dan harga kedalam model dengan skrip berikut.
Esensi
Linear regression sangat amat dibutuhkan sebagai framework berfikir kita dalam membuat rancangan machine learning. Setidaknya konsepnya akan hampir sama dengan model lain. Tapi ingat, tidak semua datset membutuhkan model linear regression, kita hanya memilihi model yang disitu tergantung pada isi data. Apabila, kita salah memilih model. Maka prediksi yang akan kita buat akan selalu menimbulkan bias
Linear regression sederhananya membantu kita mengerti apa hubungan antara dua domain data untuk mempermudah inputan data atau pengumpulan data yang akan datang
Setelah ini, kalian harus lebih mendalami model, kategori, dan mempelajari sintaks sintaks library machine learning. Terutama llibrary tensorflow, sklearn, dan panda. DAn mengembangkan beberapa project dengan permodelan machine learning.