Mengapa Ilmu Data - Pembelajaran mesin
Pembelajaran mesin
Machine Learning adalah ilmu untuk membuat komputer belajar dan bertindak seperti manusia, dan meningkatkan pembelajaran mereka dari waktu ke waktu secara otonom, dengan memberi mereka data dan informasi dalam bentuk pengamatan dan interaksi dunia nyata. Ini telah mengambil dunia Ilmu Data oleh badai.
Itu bisa bercabang ke dalam kategori berikut:
Pembelajaran terawasi
Pembelajaran tanpa pengawasan
Supervised Learning adalah ketika data diberi label dan program belajar untuk memprediksi output dari input data. Misalnya, algoritma pembelajaran terawasi untuk deteksi penipuan kartu kredit akan digunakan sebagai input serangkaian transaksi yang direkam. Itu akan belajar apa yang membuat transaksi cenderung menjadi penipuan. Kemudian, untuk setiap transaksi baru, program akan memprediksi apakah itu curang atau tidak.
Pembelajaran tanpa pengawasan adalah tempat data tidak berlabel dan program belajar mengenali struktur yang melekat dari data input. Untuk contoh penipuan yang sama, model akan menerima banyak transaksi tanpa indikasi apakah mereka curang atau tidak, dan akan mengelompokkannya berdasarkan pola yang dilihatnya. Mungkin menemukan dua kelompok, curang dan sah.
Instruksi
1. Aplikasi seluler Codecademy baru saja diluncurkan di App Store dan Catherine baru saja mendapatkan beberapa data!
Dia menggunakan algoritma belajar tanpa pengawasan untuk membangun model yang mengelompokkan pengguna ponsel Codecademy menjadi dua kelompok.
Query :
import codecademylib3_seaborn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
mu = 1
std = 0.5
mu2 = 4.188
np.random.seed(100)
xs = np.append(np.append(np.append(np.random.normal(0.25,std,100), np.random.normal(0.75,std,100)), np.random.normal(0.25,std,100)), np.random.normal(0.75,std,100))
ys = np.append(np.append(np.append(np.random.normal(0.25,std,100), np.random.normal(0.25,std,100)), np.random.normal(0.75,std,100)), np.random.normal(0.75,std,100))
values = list(zip(xs, ys))
model = KMeans(init='random', n_clusters=2)
results = model.fit_predict(values)
plt.scatter(xs, ys, c=results, alpha=0.6)
colors = ['#6400e4', '#ffc740']
for i in range(2):
points = np.array([values[j] for j in range(len(values)) if results[j] == i])
plt.scatter(points[:, 0], points[:, 1], c=colors[i], alpha=0.6)
plt.title('Codecademy Mobile Feedback - Data Science')
plt.xlabel('Learn Python')
plt.ylabel('Learn SQL')
plt.show()
Hasilnya :
<< Home