Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Bermain Twitter dengan R (Part 5) – Sentiment Analysis (Go-Jek vs Grab vs Uber)

“The more complex the world situation becomes, the more scientific and rational analysis you have to have, the less you can do with simple good will and sentiment.”

~ Reinhold Niebuhr

Akhirnya (setelah berpanjang-panjang), sampailah kita pada pembahasan yang paling ditunggu-tunggu, hands-on sentiment analysis with R! Prok prok prok.. πŸ˜€

Material yang akan kita analisis sentimennya adalah tweet konsumen maupun media, tentang aplikasi transportasi online, yaitu Go-Jek, Grab, dan Uber. Sebelum dimulai, mohon dibaca peringatan berikut ini:Baca selebihnya »

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Bermain Twitter dengan R (Part 4) – Pengantar Algoritma Klasifikasi Sentimen

“All models are approximations. Essentially, all models are wrong, but some are useful. However, the approximate nature of the model must always be borne in mind.”

~ George E. P. Box

Pada postingan minggu lalu, kita telah membahas langkah-langkah opinion mining/sentiment analysis. Pada pembahasan kali ini, kita akan sedikit membahas mengenai beragam algoritma yang biasa digunakan untuk mengklasifikasikan sentimen.

Klasifikasi sentimen memang bukan perkara yang mudah. Meskipun begitu, terdapat beragam algoritma klasifikasi yang dapat diterapkan pada kasus opinion mining/sentiment analysis. Algoritma-algoritma tersebut beragam, mulai dari classifier probabilistik sederhana seperti Naive Bayes (probability classifier yang mengasumsikan semua feature saling independen satu sama lainnya, dan tidak menggunakan/melibatkan informasi sebelumnya (prior information), hingga classifier yang lebih advanced seperti Maximum Entropy Classifier (yang menggunakan informasi prior hingga batasan tertentu).Baca selebihnya »

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Bermain Twitter dengan R (Part 3) – Pengantar Sentiment Analysis

“While the individual man is an insoluble puzzle, in the aggregate he becomes a mathematical certainty. You can, for example, never foretell what any one man will be up to, but you can say with precision what an average number will be up to. Individuals vary, but percentages remain constant. So says the statistician.”

~ Arthur Conan Doyle

Sebelum kita masuk ke praktik/hands on pada sentiment analysis, ada baiknya kita pelajari bersama dahulu teori-teori di belakangnya, agar tidak terlalu black box. πŸ™‚

Secara sederhana, opinion mining atau sentiment analysis adalah metode untuk menilai opini/sentimen yang muncul dari suatu frasa atau kalimat. Seringkali dokumentasi lengkap (dataset, corpus, dll) yang tersedia mengenai sentiment analysis ini dalam bahasa Inggris, namun secara teoretik, sentiment analysis dapat dilakukan dalam bahasa apapun.

Sumber data/kalimat yang digunakan untuk sentimen analisis pun dapat bersumber dari manapun-baik itu tweet dengan total 140 karakter, Facebook post atau chat, forum post Kaskus, SMS, dll.

Berikut ini adalah contoh sederhana kalimat-kalimat beserta sentimennya:Baca selebihnya »

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Bermain Twitter dengan R (Part 2) – Finding Trending Topics

“Social media makes it extraordinarily easy to join crusades, express solidarity and outrage, and shun traitors. Facebook was founded in 2004, and since 2006 it has allowed children as young as 13 to join. This means that the first wave of students who spent all their teen years using Facebook reached college in 2011, and graduated from college only this year.

These first true β€œsocial-media natives” may be different from members of previous generations in how they go about sharing their moral judgments and supporting one another in moral campaigns and conflicts. We find much to like about these trends; young people today are engaged with one another, with news stories, and with prosocial endeavors to a greater degree than when the dominant technology was television. But social media has also fundamentally shifted the balance of power in relationships between students and faculty; the latter increasingly fear what students might do to their reputations and careers by stirring up online mobs against them.”

~ Greg Lukianoff, Jonathan Haidt, “The Coddling of the American Mind”, The Atlantic, (September 2016).

Halo, apa kabar semuanya? :*

Sebagai lanjutan dari “Bermain Twitter dengan R, Part 1”, di postingan kali ini, kita akan membahas tips & trick yang insyaAlloh akan lebih berfaedah lagi, yaitu cara memperoleh trending topic di suatu daerah tertentu, maupun di seluruh dunia!

Sebelumnya, kita perlu mengakses twitter API terlebih dahulu, menggunakan API credentials dengan cara seperti dijabarkan pada Part 1. Jika sudah berhasil mengakses kembali aplikasi twitter kita, maka jalankanlah script berikut ini, untuk mengetahui available trend location, atau lokasi yang tersedia layanan untuk kita pantau trending topicsnya. πŸ™‚Baca selebihnya »

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Bermain Twitter dengan R (Part 1) – Preparations

“That is the central tenet of twenty- first-century Western philosophy: “I tweet, therefore I am.””

~ John O’Farrell

Siapa bilang Data Scientist dan Data Analyst tidak pernah bermain social media? πŸ˜›

Sosial media adalah channel untuk komunikasi massa, seperti media promosi brand, maupun media untuk berbagi konten oleh masyarakat kekinian. Kepopuleran sosial media meningkat secara eksponensial setiap waktunya, dengan pembengkakkan pengguna online dan produksi data yang sangat masif pula. Hal-hal inilah yang menjadikan social media data menjadi ladang emas untuk menggali insights, oleh para Data Scientist maupun periset pada umumnya.

Jadi, jawabannya, iya. Kami pun bermain social media, mungkin caranya saja yang agak berbeda. πŸ˜€

Pada postingan kali ini, kita akan melakukan langkah-langkah persiapan untuk berinteraksi dengan Twitter API, menggunakan R.

Silakan teman-teman kunjungi https://apps.twitter.com/app/new terlebih dahulu untuk membuat aplikasi Twitter anda (jika sudah pernah buat, silakan diskip saja, kita hanya membutuhkan API key, dll yang akan dibahas kemudian), yang akan kita pergunakan untuk langkah-langkah berikutnya (silakan dicoba sendiri ya pembuatannya, mudah kok, dan silakan googling apabila menemui kesulitan, googling also important part of learning in these days :P).

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz
Sumber Gambar: Pengalaman Pribadi.

Yang paling kita butuhkan dari penggunaan API ini adalah:Baca selebihnya »