Ringkasan 'Public Reaction to Scientific Research via Twitter Sentiment Prediction'

Tulisan ini dibuat sebagai tugas dari mata kuliah Kapita Selekta

Pengguna media sosial berbagi ide, pemikiran, dan emosi mereka dengan pengguna lain. Namun, tidak jelas bagaimana pengguna online akan menanggapi penelitian baru hasil. Penelitian ini bertujuan untuk memprediksi sifat emosi yang diungkapkan oleh Twitter pengguna terhadap publikasi ilmiah. Selain itu, kami menyelidiki fitur apa dari artikel penelitian membantu dalam prediksi tersebut. Mengidentifikasi sentimen artikel penelitian di media sosial akan membantu para ilmuwan mengukur dampak sosial baru dari penelitian mereka artikel.

 Metodologi yang digunakan adalah mengkategorisasikan nilai nilai sentimen yang ada dengan skala negatif, positif dan netral

Sebelumnya metode ini pernah digunakan untuk mencari sentimen yang ada dalam jurnal jurnal saintifik, namun pada jurnal kali ini akan digunakan untuk menguji dan memeriksa sentimen yang ada dalam platform social media yaitu Twitter

Ada beberapa tools dan metode untuk mengolah data data tweet

1. NLTK2 VADER (Valence Aware Dictionary and sEntiment Reasoner) adalah alat analisis sentimen leksikal dan berbasis aturan di Perangkat Bahasa Alami perpustakaan (NLTK). Komponen VADER, penganalisis intensitas sentimen menghasilkan skor polaritas majemuk untuk teks. Skor ini adalah nilai berkelanjutan dalam kisaran -1 (negatif) hingga +1 (positif). Kami menggunakan versi 3.6.2 dari perpustakaan NLTK.

2. TextBlob3 adalah perpustakaan yang digunakan untuk berbagai tujuan, seperti penandaan bagian-of speech, ekstraksi frase kata benda, dan analisis sentimen.

3. Stanford CoreNLP4 adalah adalah perpustakaan yang dibangun di Jawa. Untuk Stanford CoreNLP,
Paket Python berinteraksi dengan perpustakaan di server yang berjalan di latar belakang pada platform Jawa. Perpustakaan ini menghasilkan skor sentimen sebagai berikut: sangat negatif = 0, negatif = 1, netral = 2, positif = 3, dan sangat positif = 4. Kami menggunakan versi 4.2.0 dari perpustakaan Stanford CoreNLP.

4. SentiStrength5 adalah algoritma oleh Thelwall et al. (2010) digunakan untuk mengekstrak sen-
waktu teks informal. Kami menggunakan pembungkus Python dari algoritma ini untuk menghasilkan sentimen ternary: negatif = -1, netral = 0, positif = 1.

5. Sentiment1406 adalah alat analisis sentimen yang dirancang khusus untuk Twitter. Kami menggunakan API sentimen140 untuk menanyakan sentimen tweet dan mendapatkan polaritas sebagai negatif = 0, netral = 2, dan positif = 4.

Lalu kita membuat tiga macam model machine learning

1. Classification models untuk memprediksi sentimen tweet sebagai label kelas biner (positif dan negatif)
2. Classification models untuk memprediksi sentimen tweet sebagai salah satu dari tiga label kelas (positif, netral, dan negatif)
3. Regression models untuk memprediksi skor sentimen tweet yang tepat.

Link Download Jurnal

Comments

Video Baru!