Tulisan ini dibuat untuk menjelaskan ringkasand dari sebuah artikel/jurnal seputar teknik machine learning.
Ketika kita membangun/mempunyai platform untuk layanan streaming video (misalnya Youtube) kita membutuhkan storage yang besar untuk bisa menampung video yang diupload dari seluruh dunia.
Namun, tentu penyimpanan yang dibutuhkan sangat terbatas dan memakan biaya. Maka dari itu butuh sebuah metode atau teknik yang memungkinkan kita hanya menyimpan video video yang menarik saja dan menghapus video video yang jarang ditonton
Caranya adalah dengan menghitung dan mengkalkulasikan beberapa faktor yang ada di bawah ini.
1. Popularity
Adalah beberapa video yang memiliki view tersering dalam kurun waktu 30 hari
2. Storage Cost
Harga storage yang diberikan oleh Amazon Web Service dalam kasus ini
3. Transcoding Cost
Adalah biaya yang dikenakan pada provider tergantung dari seberapa banyak view yang diperoleh masing masing video
4. Cost Ratio
adalah hasil dari pembagian biaya storage dari AWS lalu dibagi dengan Trancoding Cost, yaitu biaya untuk beberapa viewnya
5. Proposed Prediction Method
Metode untuk menentukan apakah sebuah video layak masih tersimpan dalam sebuah database atau belum jika Cost Ration lebih dari 1.
Ke-lima hal di atas menjadi patokan untuk memprediksi video manakah yang memiliki views terendah dan tertinggi untuk 30 hari ke depan menggunakan linear regression
6. Proposed Algorithm
Adalah metode untuk memprediksi keseluruhan data data video yang ada berdasarkan parameter parameter di atas
Setelah itu kita membangun eksperiment set up dimana kita membutuhkan beberapa hal
1. Video Synthesis
Karena mengambil video video sangat sulit dari provider, maka kita bisa menggunakan metadata yang tersedia untuk menghitungnya seperti video size dan transcoding cost.
2. Amazon Storage Rates
Biaya penyimpanan dari AWS
3. Approache's For Comparison
membandingkan metode metode lainnya seperti Partial storing method, Clustering video streams, Clustering GOPs Clustering Method