TUJUAN PEMBELAJARAN
menggunakan alat bantu untuk menulis, menjalankan, dan mengembangkan program analisis data;
memahami pengkoleksian data melalui berbagai cara, khususnya secara otomatis melalui perangkat;
memahami transformasi data;
melakukan interpretasi data dan memahami aspek privasi dan keamanan data
Apakah kalian pernah memakai mesin pencari seperti Google, Bing, Yahoo atau lainnya untuk mencari data? Dengan mengetikkan satu atau lebih kata kunci, semua halaman web yang mengandung apa yang kalian ketikkan tersebut muncul. Bagaimana mesin pencari melakukan itu?
ISTILAH PENTING
scraping : penyajian data dari berbagai informasi yang diolah untuk memperoleh rangkuman dari informasi tersebut.
header : Bagian atas (kepala) pada menu sebuah aplikasi
share : membagi
insert : menyisipkan
View ; melihat tampilan jadi aplikasi
Run : menjalankan aplikasi/ menguji aplikasi
Command : Perintah
toolbar : bar alat/perkakas pada aplikasi
print : mencetak
assigment : pemeberian nilai
array : pengelompokan data
Pernahkah kalian mengalami saat sedang mencari informasi menemukan bahwa informasinya bertebaran di beberapa, bahkan di banyak halaman web? Mungkin pada saat itu kalian melakukan pencarian dengan mesin pencari dan mendapatkan hasil berupa daftar halaman yang memuat informasi yang kalian cari. Contohnya misalnya kalian ingin membanding-bandingkan harga barang dari beberapa situs toko online. Kalian harus membuka halamannya satu per satu, kemudian membandingkan, dan memutuskan akan membeli barang sesuai dengan kriteria yang kalian tetapkan. Jika membuka semua halaman web tersebut harus dilakukan manual, akan sangat melelahkan dan membosankan
bukan? Bayangkan jika ada robot yang dapat melakukannya untuk kalian, sehingga mudah untuk menganasis. Tentunya pengambilan keputusan akan menjadi lebih cepat. Robot itu tidak harus berwujud seperti manusia lho. Robot dapat berupa sebuah perangkat lunak komputer. Nah, pada unit ini kalian akan membuat sebuah robot seperti ini yang akan membantu kalian.
Setelah lulus kuliah, apa yang kalian lakukan jika ingin mencari pekerjaan? Atau mungkin selama kuliah juga ingin mencari pekerjaan sambilan (part time)? Untuk mencari lowongan pekerjaan, kita menggunakan koran atau pun halamanweb, misalnya JobsID.
Coba ketik https://www.karir.com/ di browser. Di halaman ini, kalian dapat mencari pekerjaan dengan memasukkan kata kunci pekerjaan di form pencarian yang ada.
Coba ketikkan nama lokasi Kota Bengkulu pada kolom pencarian
atau ketikkan nama bidang pekerjaan di kolom pencarian
Pengertian Analisis Data
Analisis data adalah proses mengorganisasikan, meringkas, dan menginterpretasi data untuk mengidentifikasi pola, tren, dan hubungan. Analisis data dapat dilakukan dengan berbagai metode, mulai dari metode sederhana seperti tabel dan grafik hingga metode yang lebih kompleks seperti statistik dan machine learning.
Jenis Analisis Data
Analisis data dapat dibagi menjadi dua jenis secara umum, yaitu analisis data kuantitatif dan analisis data kualitatif.
Analisis data kuantitatif menggunakan angka dan statistik untuk menganalisis data. Analisis data kuantitatif sering digunakan dalam bidang-bidang seperti bisnis, ekonomi, dan sains.
Analisis data kualitatif menggunakan teks dan gambar untuk menganalisis data. Analisis data kualitatif sering digunakan dalam bidang-bidang seperti sosiologi, antropologi, dan sejarah.
Fungsi Analisis Data
Analisis data memiliki berbagai fungsi, antara lain:
Menemukan pola dan tren
Mengidentifikasi hubungan
Membuat keputusan
Menebak masa depan
Prosedur Analisis Data
Proses analisis data terdiri dari beberapa langkah, yaitu:
Mengumpulkan data
Mempersiapkan data
Melakukan analisis data
Menafsirkan hasil analisis
Penerapan Analisis Data
Analisis data dapat diterapkan dalam berbagai bidang, antara lain:
Bisnis
Ekonomi
Sains
Sosiologi
Antropologi
Sejarah
Kesehatan
Pendidikan
Contoh Analisis Data
Berikut adalah beberapa contoh analisis data:
Sebuah perusahaan menggunakan analisis data untuk mengetahui produk apa yang paling populer di kalangan pelanggannya.
Sebuah bank menggunakan analisis data untuk memprediksi risiko kredit nasabahnya.
Sebuah pemerintah menggunakan analisis data untuk mempelajari perilaku masyarakatnya.
Kesimpulan
Analisis data adalah proses penting yang dapat digunakan untuk mendapatkan informasi dari data. Analisis data dapat diterapkan dalam berbagai bidang dan memiliki berbagai fungsi.
Dalam kajian analisis data, terdapat teknik yang disebut sebagai scraping. Scraping adalah salah satu bentuk penyalinan, di mana data tertentu dikumpulkan dan disalin dari sebuah halaman web, bisa ke dalam basis data, spreadsheet atau tampilan tertentu untuk pengambilan atau analisis data. Scraping bisa dilakukan dengan menggunakan sebuah bahasa pemrograman yang mendukung. Dengan scraping, kita bisa mendapatkan rangkuman dari suatu halaman web sehingga banyaknya lowongan yang sebelumnya ditampilkan dalam beberapa scroll kini menjadi diringkas dalam satu tampilan dengan data penting yang kita inginkan saja.
Dalam aktivitas di unit pembelajaran ini, kita akan melakukan scraping dengan membuat program yang mengambil data dari sebuah halaman website. Untuk membangun sebuah scraper, kita perlu menentukan bahasa pemrograman yang memudahkan kita. Setiap bahasa pemrograman akan diimplementasi oleh sebuah lingkungan pengembangan terintegrasi (Integrated Development Environment/IDE) tertentu. Ada banyak pilihan bahasa pemrograman beserta IDE-nya. Disini kita akan menggunakan bahasa pemrograman Python.
Bahasa Python dipilih karena menjadi bahasa yang sering digunakan dalam analisis data. Python memiliki banyak sekali fungsi dan library (pustaka) yang memudahkan kita untuk melakukan analisis data, salah satunya untuk melakukan scraping ini. Kemudian untuk membuat program Python, kita memerlukan alat bantu IDE atau lingkungan kerja untuk menulis dan menjalankan program Python tersebut. Salah satu alat bantu yang bisa kita gunakan ini yaitu Google Collaboratory atau Google Colab. Google Colab dipilih karena dapat digunakan secara online untuk mengambil data dari website yang online pula. Selain itu, banyak fungsi dan pustaka Python yang sudah terpasang dalam Google Colab sehingga bisa langsung digunakan.
Kita akan mulai dengan pengenalan alat bantu Google Colab dan Python. Setelah cukup mengenal dua alat bantu analisis data ini, mulailah kita membuat proyek untuk scraping halaman website yang dipilih. Kemudian setelah itu, data hasil scraping ini divisualisasikan ke dalam berbagai bentuk diagram dan chart.
Untuk dapat membuat Scrapper diperlukan bahasa pemrograman. Bahasa pemrograman yang akan digunakan pada Bab ini adalah:
Google Colaboratory
Phyton
Google Collaboratory merupakan bahasa pemrograman yang disediakan secara online oleh Google. Aplikasi ini tidak perlu di instalkan pada perangkat komputer. Google Colaboratory, atau yang biasa disingkat Colab, adalah layanan notebook Jupyter yang dihosting dan dapat digunakan tanpa penyiapan, serta menyediakan akses tanpa biaya ke resource komputasi termasuk GPU. Colab memungkinkan siapa saja untuk menulis dan mengeksekusi kode Python arbitrer melalui browser, dan sangat cocok untuk machine learning, analisis data, serta pendidikan.
Berikut adalah beberapa penggunaan Google Colab yang umum:
Machine learning
Colab adalah alat yang sangat populer untuk pembelajaran mesin. Ini memungkinkan Anda untuk menulis dan menjalankan kode pembelajaran mesin tanpa perlu menginstal perangkat lunak apa pun di komputer Anda. Colab juga menyediakan akses ke GPU, yang dapat mempercepat pelatihan model pembelajaran mesin.
Analisis data
Colab adalah alat yang sangat serbaguna untuk analisis data. Ini memungkinkan Anda untuk membaca dan menulis data dari berbagai sumber, serta menggunakan berbagai library Python untuk menganalisis data.
Pendidikan
Colab adalah alat yang sangat efektif untuk pendidikan. Ini memungkinkan siswa untuk belajar tentang pemrograman dan pembelajaran mesin dengan cara yang interaktif dan menarik.
Selain penggunaan-penggunaan umum di atas, Colab juga dapat digunakan untuk berbagai tugas lainnya, seperti:
Pengembangan web
Ilmu komputer
Sains
Teknik
Bisnis
1. Buat akun Google
Untuk membuat akun Google, buka situs web Google dan klik tombol "Buat akun". Ikuti instruksi di layar untuk membuat akun Anda.
2. Buka Google Drive
Untuk membuka Google Drive, buka situs web Google Drive atau klik ikon Google Drive di bilah alat Google Chrome.
3. Buat folder
Untuk membuat folder di Google Drive, klik tombol "New" di sudut kiri atas, lalu pilih "Folder". Masukkan nama untuk folder Anda, lalu klik "Create".
4. Buka notebook Colab
Untuk membuka notebook Colab, klik tombol "New" di sudut kiri atas, lalu pilih "Google Colaboratory".
5. Tulis kode Python
Untuk menulis kode Python, klik sel kosong di notebook, lalu mulai mengetik kode Anda. Anda dapat menggunakan sintaks Python standar untuk menulis kode Anda.
6. Jalankan kode
Untuk menjalankan kode, klik tombol "Run" di sudut kanan atas sel kode. Kode Anda akan dijalankan di server Google dan hasil dari kode Anda akan ditampilkan di sel kode.
7. Simpan notebook
Untuk menyimpan notebook, klik tombol "Save" di sudut kiri atas notebook. Notebook Anda akan disimpan ke folder yang Anda buat di Google Drive.
8. Bagikan notebook
Untuk berbagi notebook, klik tombol "Share" di sudut kanan atas notebook. Anda dapat membagikan notebook dengan siapa saja dengan memberikan mereka tautan ke notebook Anda.
Berikut adalah beberapa tips untuk menggunakan Google Colab:
Gunakan Markdown (#) untuk menulis komentar dan dokumentasi
Markdown adalah format teks sederhana yang dapat digunakan untuk menulis komentar dan dokumentasi di notebook Colab. Anda dapat menggunakan Markdown untuk menjelaskan apa yang dilakukan kode Anda atau untuk memberikan informasi tambahan.
Gunakan library Python yang tersedia
Colab memiliki banyak library Python yang tersedia untuk digunakan. Anda dapat menggunakan library ini untuk membuat kode Anda lebih kompleks dan efisien.
Berkolaborasi dengan orang lain
Colab mendukung kolaborasi. Anda dapat bekerja sama dengan orang lain pada notebook Colab yang sama.
Contoh Kode Phyton
Menulis kalimat
print("Kami senang belajar coding")
Menghitung Luas Lingkaran
#Menghitung Luas Lingkaran#
import math
jari_jari = float(input("Masukkan jari-jari lingkaran: "))
luas = math.pi * jari_jari ** 2
print("Luas lingkaran adalah:", luas)
Menghitung luas Persegi
# Menghitung luas persegi#
panjang = float(input("Masukkan panjang persegi: "))
lebar = float(input("Masukkan lebar persegi: "))
luas = panjang * lebar
print("Luas persegi adalah:", luas)
Menghitung Luas segitiga
#Menghitung luas segitiga#
alas = float(input("Masukkan alas segitiga: "))
tinggi = float(input("Masukkan tinggi segitiga: "))
luas = (alas * tinggi) / 2
print("Luas segitiga adalah:", luas)
Menghitung kembalian uang belanja
#Menghitung Uang Kembalian#
def hitung_kembalian(total_belanja, uang_bayar):
"""
Fungsi untuk menghitung kembalian uang belanja di mini market.
Parameter:
total_belanja: Jumlah total belanjaan
uang_bayar: Jumlah uang yang dibayarkan
Mengembalikan:
Jumlah uang kembalian
"""
kembalian = uang_bayar - total_belanja
return kembalian
if __name__ == "__main__":
# Input jumlah total belanjaan
total_belanja = float(input("Masukkan jumlah total belanjaan: "))
# Input jumlah uang yang dibayarkan
uang_bayar = float(input("Masukkan jumlah uang yang dibayarkan: "))
# Hitung kembalian
kembalian = hitung_kembalian(total_belanja, uang_bayar)
# Tampilkan kembalian
print("Jumlah uang kembalian:", kembalian)
Untuk membantu berkomunikasi dengan komputer, kita perlu sebuah bahasa yang dipahami baik oleh manusia maupun komputer, dalam hal ini bahasa Pemrograman. Secara umum, bahasa pemrograman adalah bahasa yang digunakan untuk membuat program yang akan memberikan perintah kepada komputer untuk melakukan sesuatu. Ada berbagai jenis bahasa pemrograman yang dapat digunakan untuk membuat program. Salah satu bahasa pemrograman yang sering digunakan untuk melakukan analisis data karena menyediakan library untuk berbagai tahap proses analisis data, ialah bahasa Python. Python merupakan bahasa pemrograman yang cukup populer, seperti halnya bahasa C yang digunakan dalam unit pembelajaran Algoritma dan Pemrograman. Pada bagian ini, akan dibahas beberapa dasar pemrograman Python, terutama yang terkait dengan analisis data. Perhatikan bahwa pemrograman di materi analisis data ini hanya digunakan sebagai alat bantu. Algoritma dan pemrograman juga akan sedikit disinggung dalam unit pembelajaran ini sebagai bentuk latihan dan eksplorasi, memahami eksekusi yang terjadi khususnya dalam setiap proses analisis data. Jadi, kalian tidak perlu terlalu bingung memikirkan aturan bahasa pemrograman Python yang diberikan.
Langkah Kerja :
Ketikkan print
Dalam tanda kurung ( ) beri tanda petik dua lalu tuliskan kalimat contoh: "Hello World"
klik kiri run ▶️
Latihan 1
1. Gantilah data dalam print dengan print(“2 + 3”), kemudian jalankan (Run). Apa hasilnya?
2. Kemudian, ganti kembali data dalam print dengan print(2 + 3). Apa hasilnya?
3. Ganti kembali data dalam print dengan print(“2” + “3”). Apa hasilnya?
4. Apa makna dari penggunaan tanda petik tersebut?
Tanda petik digunakan untuk mencetak data string, yang berupa nilai alfanumerik dan tanda baca, yang tidak memiliki nilai aritmatika. Artinya, string “2” ditambah (atau lebih tepatnya dijejerkan) dengan string “3”, hasilnya string “23”. Tidak masuk akal string “2” dikurangi atau dikalikan string “3”, sedangkan jika bilangan 2 dikurangi atau dikalikan 3, pasti ada nilai bilangannya. Sampai di sini, apakah kalian paham? Silakan, diskusikan dengan teman dan guru kalian.
Pemrograman Python di sini serupa dengan pemrograman C di unit pembelajaran Algoritma Pemrograman. Di program-program selanjutnya, kalian akan belajar Python dengan pendekatan prosedural seperti halnya belajar C. Untuk melihat hubungannya, kalian bisa melihat kembali tabel perbandingan bahasa Python dan bahasa C di unit pembelajaran Algoritma Pemrograman.
Langkah Kerja :
ketikkan bil1 = 5 , lalu tekan enter
ketikkan bil2 = 10 lalu tekan enter
ketikkan jumlah = bil1+bil2 lalu tekan enter
ketikkan jumlah
run
Latihan 2
ketikkan kan coding berikut !
bil1 = 10
bil2 = 5
bil2
jumlah = bil1 + bil2
jumlah
Jalankan perintah run
Apakah coding diatas bisa di eksekusi oleh program?
Latihan 3
ketikkan kan coding berikut dengan menambahkan perintah print !
bil1 = 10
bil2 = 5
print (bil2)
jumlah = bil1 + bil2
print (jumlah)
Jalankan perintah run
Apakah kedua variabel (print) tersebut dapat tercetak?
Dalam kehidupan sehari-hari, kita akan menemui data yang memiliki banyak nilai, termasuk daftar nilai mata pelajaran Informatika sebuah kelas, misalnya. Menuliskan sebuah array dapat dilakukan dengan menggunakan tanda kurung siku seperti dibawah ini :
Latihan 4
Ketikkan coding berikut ini :
data = [10, 9, 7, 8, 10, 8]
print(data[1])
Jalankan Perintah Run
Jawablah Pertanyaan berikut ini:
Angka Berapakah yang muncul saat dijalankan perintah Run?
Mengapa angka sembilan dalam indeks array masuk dalam indeks pertama?
Lanjutkan dengan mengetikkan coding berikut ini:
data = [10, 9, 7, 8, 10, 8]
print(data[1])
data[2] = 10
print(data)
data.append(35)
print(data)
Jawablah Pertanyaan Berikut Ini:
Tuliskan data yang tercetak pada perintah print di baris ke 2?
Tuliskan data yang tercetak pada perintah print di baris ke 4?
Tuliskan data yang tercetak pada perintah print di baris ke 6?
Perintah apa yang dijalankan oleh program dalam eksekusi print pada baris ke 2?
Perintah apa yang dijalankan oleh program dalam eksekusi print pada baris ke 6?
Loop:for dalam Python digunakan untuk melakukan pengulangan (iterasi) terhadap sebuah objek atau sekelompok nilai secara otomatis. Dengan menggunakan loop:for, kita dapat menghemat waktu dan tenaga dalam menulis kode.
Latihan 5
Ketikkan coding berikut ini:
data = [10, 9, 7, 8, 10, 8]
indeks = 0
for elemen in data:
print("elemen ke", indeks, "=", elemen)
indeks = indeks + 1
Jalankan Perintah run
Lakukan uji Coba dan jawablah pertanyaan berikut ini:
1. Perhatikan baris kelima Gambar diatas Mengapa nomor indeks yang dicetak di baris sebelumnya perlu ditambah 1 setiap perulangan?
2. Bagaimana jika diganti, indeks ditambah dengan 2? Apa keluarannya?
3. Bagaimana jika dipindah, penambahan indeks dilakukan di baris keempat? Apa output-nya?
array bisa diisi dengan satu jenis data misalnya seperti bilangan namun bisa juga diisi dengan teks tulisan. untuk teks biasanya diapit dengan tanda petik dua "....." seperti yang terlihat dalam gambar disamping.
Latihan 6
Ketikkan coding berikut ini:
data = [10, 9, "Informatika", 4, "8", 7 , "Python"]
for x in data:
try:
print(x/2)
Jalankan perintah run
Jawablah pertanyaan berikut ini:
Apakah yang terjadi pada saat dijalankan perintah run?
Latihan 7
Perbaiki coding diatas dengan menambahkah perintah except:
data = [10, 9, "Informatika", 4, "8", 7 , "Python"]
for x in data:
try:
print (x / 2)
except:
print("Bukan Bilangan")
Jalankan perintah run
Jawablah pertanyaan berikut ini:
Apakah eksekusi perintah print bisa dijalankan dalam program?
coba ubah perintah print (x / 2) dengan print ( x * 5 ) jalankan perintah run. apakah data yang tercetak berubah? apa sebenarnya yang terjadi?
Cobalah ganti print("Bukan Bilangan") dengan mengganti teks "Bukan Bilangan" dengan tulisan apa saja sesukamu, apa yang terjadi saat dijalankan perintah run?
Blok perintah try-except merupakan salah satu perintah yang digunakan untuk kasus percabangan untuk menguji suatu kondisi, dalam hal ini kasus
kesalahan atau tidak. Ada perintah lain yang dapat digunakan untuk menangani kasus percabangan (branch), seperti perintah if dan blok perintah if-else
Fitur library atau pustaka di sebuah pemrograman memungkinkan kita untuk mendapatkan fungsionalitas yang tidak ada di program kita. Fungsionalitas ini disediakan oleh penyedia bahasa pemrograman atau komunitas tertentu yang memang sering menggunakan fungsionalitas tersebut. Library atau pustaka adalah koleksi program dan paket yang tersedia untuk berbagai penggunaan. Untuk lebih memahami fungsi dari library pandas coba praktek kan penggunaan coding berikut ini:
Latihan 8
Ketikkan code berikut ini!
import pandas
absen = [1,2,3,4,5]
siswa = ["ayu", "Budi", "Cantika", "Dedy", " Edo"]
nilai = pandas.DataFrame({
"Nama" : siswa,
"No Absen" : absen
})
nilai
Jalankan Perintah Run
Apakah kamu berhasil membuat sebuah Tabel dengan menggunakan library pandas?
Dalam tabel yang sudah di buat, Nomor absen berada pada posisi paling kanan. ubahlah coding diatas untuk menempatkan nomor absen berada di sebelah kiri nama siswa!