Analisis Statistik dan Penerapan NumPy dalam Kehidupan Sehari-hari
Gambar sampul: Analisis Statistik dan Penerapan NumPy
Dalam tugas pembelajaran ini, saya membagi materi ke dalam empat bagian utama: fungsi statistik , data berkelompok , perhitungan varians , dan penerapan dalam kehidupan sehari-hari . Setiap bagian dilengkapi dengan kode Python dan penjelasan detail agar mudah dipahami dan relevan dengan konteks pembelajaran. Untuk kompatibilitas, saya juga menyertakan pustaka array bawaan Python.
1. Fungsi Statistik
Sebelum kita masuk ke studi kasus, penting untuk memahami dasar-dasar fungsi statistik yang disediakan oleh NumPy. Fungsi-fungsi ini membantu kita menganalisis data secara kuantitatif, mulai dari mencari nilai minimum hingga menghitung standar deviasi.
import numpy as np # Pustaka utama untuk analisis numerik
import array as arr # Array bawaan Python, disertakan untuk kompatibilitas
data = np.array([2, 9, 1, 5, 4])
print(np.amin(data)) # Nilai minimum → 1
print(np.amax(data)) # Nilai maksimum → 9
data = np.array([12, 5, 20, 3, 18, 9])
print(np.ptp(data)) # Rentang data (max - min) → 17
data = np.array([1,2,3,4,5,6,7,8,9,10])
print(np.percentile(data, 25)) # Q1 → 3.25
print(np.percentile(data, 50)) # Median → 5.5
print(np.percentile(data, 75)) # Q3 → 7.75
data_ganjil = np.array([2, 5, 1, 8, 4])
print(np.median(data_ganjil)) # Median → 4
data = np.array([2, 4, 6, 8, 10])
print(np.mean(data)) # Rata-rata → 6.0
nilai = np.array([90, 80, 75])
bobot = np.array([0.2, 0.3, 0.5])
print(np.average(nilai, weights=bobot)) # Rata-rata berbobot → 79.5
print(np.std(data)) # Standar deviasi → 2.828
2. Data Berkelompok: Skor Permainan
Dalam kehidupan nyata, data sering kali disajikan dalam bentuk kelompok atau interval. Misalnya, skor permainan yang dibagi ke dalam jarak tertentu. Di bagian ini, kita akan belajar bagaimana menghitung titik tengah, rata-rata, varians, dan standar deviasi dari data berkelompok menggunakan NumPy.
interval_skor = np.array([200, 300, 400, 500, 600, 700]) # Batas interval skor
frekuensi = np.array([10, 15, 25, 12, 8]) # Jumlah pemain per interval
midpoints = (interval_skor[:-1] + interval_skor[1:]) / 2 # Titik tengah tiap interval
mean = np.sum(midpoints * frekuensi) / np.sum(frekuensi) # Rata-rata skor
varians = np.sum(((midpoints - mean)**2) * frekuensi) / np.sum(frekuensi) # Varians
std_deviasi = np.sqrt(varians) # Standar deviasi
print(midpoints) # Titik tengah
print(mean) # Rata-rata skor
print(varians) # Sebaran data
print(std_deviasi) # Standar deviasi
3. Varian
Varians adalah salah satu konsep statistik yang menunjukkan seberapa luas data dari nilai rata-ratanya. Semakin besar variannya, semakin besar pula perbedaan antar data. Di bagian ini, kita akan menggunakan fungsi np.var()untuk menghitung varians dari array sederhana.
data = np.array([1, 2, 3, 4, 5])
print(np.var(data)) # Varians → 2.0
4. Contoh Penerapan NumPy dalam Kehidupan Sehari-hari
Setelah memahami fungsi-fungsi dasar, saatnya melihat bagaimana NumPy digunakan dalam konteks nyata. Studi kasus ini menggunakan data waktu belajar dan nilai ujian siswa untuk menunjukkan bagaimana kita bisa melakukan slicing, filtering, dan analisis korelasi sederhana.
waktu_belajar = np.array([2, 5, 3, 7, 1, 6, 4]) # Waktu belajar tiap siswa
nilai_ujian = np.array([75, 95, 80, 100, 60, 90, 85]) # Nilai ujian tiap siswa
print(waktu_belajar.shape) # Bentuk array
print(waktu_belajar.dtype) # Tipe data
print(waktu_belajar.ndim) # Dimensi array
print(waktu_belajar.size) # Jumlah elemen
print(waktu_belajar[:3]) # 3 siswa pertama → [2 5 3]
print(nilai_ujian[:3]) # Nilai mereka → [75 95 80]
siswa_lulus = nilai_ujian > 85
print(waktu_belajar[siswa_lulus]) # Waktu belajar siswa yang nilainya > 85
print(nilai_ujian[siswa_lulus]) # Nilai ujian mereka
rata_rata_waktu = np.mean(waktu_belajar)
print(np.mean(nilai_ujian[waktu_belajar > rata_rata_waktu])) # Rata-rata nilai siswa yang belajar lebih lama
Kesimpulan
Melalui empat bagian ini, kita dapat melihat bagaimana NumPy mempermudah proses analisis data, baik untuk data individu maupun data berkelompok. Dengan sintaks yang ringkas dan fungsi statistik yang lengkap, NumPy menjadi alat yang sangat berguna dalam pembelajaran sains data dan analisis kuantitatif.
Semoga bermanfaat dan selamat mencoba!
0 Komentar