Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Berkenalan dengan scikit-learn (Part 2) – datasets.make_: Membuat Sampel Data untuk Latihan Analisis Data

β€œYou can have data without information, but you cannot have information without data.”

~ Daniel Keys Moran

Pada postingan sebelumnya (part 1), kita telah mengenal langkah-langkah persiapan dalam menggunakan library scikit-learn, dan kita juga telah tahu cara mengimport datasets bawaan dari scikit-learn. Untuk lebih menajamkan sense kita untuk mengetahui kecocokan suatu tipe datasets dengan metode machine learning yang akan kita gunakan, di postingan kali ini, akan kita coba bersama, membuat datasets untuk toy analysis; atau untuk latihan analisis data, atau bahkan untuk prototyping, sebelum implementasi ke data yang sebenarnya. πŸ™‚

Di postingan kali ini, kita akan lihat perbedaan bentuk/tipe-tipe datasets untuk setiap algoritma machine learning yang berbeda.

Mari kita lihat, beragam jenis datasets yang dapat kita buat dengan scikit-learn, dengan script berikut ini:

#import library terlebih dahulu, jangan lupa
import sklearn.datasets as d
import numpy as np

#syntax untuk melihat, datasets macam apa sajakah yang bisa dibuat menggunakan scikit-learn
d.make_*?

Kita lihat hasilnya di console:Baca selebihnya »

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Movie Review, Muhammad Azizul Hakim, Aziz

Moneyball (2011) – A Movie Review from Data Scientist Perspective

Art Howe: “Do you agree with this?”
Peter Brand: “100%.”

Halo semuanya! Apa kabar? :*

Postingan kali ini adalah review film, sebagai intermezzo. Untuk ke depannya, author insyaAlloh akan menjadwalkan postingan intermezzo setiap kali selesai posting empat artikel teknis. Materinya insyaAlloh beragam.. πŸ™‚

Sedikit bercerita dulu ya, pada awalnya artikel ini adalah tugas dari Mas Satia Pradana, CEO Inspira Space, Yogyakarta. Tugas yang unik ya? Hehehe.

Karena review film/tugas ini tidak menyebarkan rahasia perusahaan, dsb, saya putuskan untuk saya share di sini, agar lebih bermanfaat untuk orang banyak. Sekian ya pengantarnya, selamat membaca! πŸ˜€

Baca selebihnya »

Berkenalan dengan scikit-learn (Part 1) – Preparations

“If one wants to make a machine mimic the behaviour of the human computer in some complex operation one has to ask him how it is done, and then translate the answer into the form of an instruction table. Constructing instruction tables is usually described as “programming”.”

~ Alan Turing

Scikit-learn adalah library untuk machine learning bagi para pengguna python. Scikit-learn merupakan free software, dan memungkinkan kita melakukan beragam pekerjaan dalam Data Science, seperti regresi (regression), klasifikasi (classification), pengelompokkan/penggugusan (clustering), data preprocessing, dimensionality reduction, dan model selection (pembandingan, validasi, dan pemilihan parameter maupun model).

Pada postingan kali ini, bersama-sama kita akan berkenalan dengan library super keren ini, dan seperti biasa, sambil praktik. Let’s get started! πŸ™‚

Baca selebihnya »