Thursday, 7 May 2020

Mengapa Ilmu Data - Menganalisis Data dengan Panda

Menganalisis Data dengan Panda

Catherine ingin tahu apakah pelajar Codecademy menemukan apa yang mereka butuhkan. Dia perlu menganalisis data dari survei yang diberikan kepada sekelompok pengunjung.

Catherine memilih data survei dari database SQL dan mengunduhnya ke komputernya. Dia menyimpan data sebagai file CSV (ekstensi .csv), yang merupakan singkatan dari Comma-Separated Values. CSV adalah format spreadsheet hanya teks yang memungkinkan kami menyimpan dan menjelajahi data.

Untuk menganalisis data survei, Catherine akan menggunakan panda. Python adalah bahasa pemrograman, dan panda adalah seperangkat perintah khusus dalam Python yang memungkinkan kita menganalisis data spreadsheet. Panda dapat melakukan banyak hal yang dapat dilakukan SQL, tetapi juga didukung oleh kekuatan Python, sehingga kita dapat dengan mudah beralih dari menganalisis data kami dengan panda ke memvisualisasikannya menggunakan alat Python lainnya.

Instruksi
1. Catherine menulis beberapa kode untuk menganalisis datanya di script.py, file di tengah layar.

Jika Anda menekan "Run" sekarang, itu akan menghasilkan kesalahan karena dia kehilangan baris kode ini:

impor panda sebagai pd

Rekatkan kode itu ke bagian atas script.py dan kemudian tekan "Run".

Anda akan melihat hasil analisis Catherine di panel kanan.


 Query :

import codecademylib3_seaborn

# Paste code here:
import pandas as pd

# Load data
df = pd.read_csv('page_visits.csv')

# Display data
print(df.head())



Hasil : 

first_namelast_namegenderagevisit_datewebsite_goal
0JamesMcguiremale50.02017-10-26Find a job
1JohnVaughanmale35.02017-11-09Pay a bill
2RobertDillonmale33.02017-11-28Pay a bill
3MichaelCameronmale40.02017-09-27When is trash day?
4WilliamYangmale38.02017-11-01Contact City Council