Source : Adzed 

Halo, Sobat Data! 

Selamat datang di #KuliahData! Di sesi ini, Sobat Data akan diajak untuk mengenali berbagai mata kuliah yang ada di Data Science Telkom University Surabaya. Mulai dari pengenalan pemograman, analisis data, dan keterampilan lain yang akan mendukung Sobat Data dalam proses belajar di Data Science Telkom University Surabaya. 

Tidak seperti biasanya, pada #KuliahData kali ini, Sobat Data akan diajak mengenal Data Cleaning, sebuah konsep yang akan sangat membantu dalam memahami dan mengelola data, baik dalam perkuliahan maupun di dunia kerja. 

Pada #KuliahData sebelumnya telah dibahas mengenai alur Data Science Lifecycle mulai dari Business Understanding hingga Model Deployment, dan #KuliahData kali ini akan dibahas lebih mendalam salah satu teknik yaitu Data Cleaning. Untuk Sobat Data yang penasaran mengenai alur Data Science Lifecycle bisa mengecek pada link ini ya! 

Data Cleaning  merupakan proses penting yang ada pada Data Science Lifecycle. Data Cleaning adalah proses mengidentifikasi dan mengoreksi data yang salah pada dataset. Selain mendeteksi kesalahan, Data Cleaning juga mendeteksi adanya error atau corrupt yang kemudian diperbaiki atau dihapus data jika memang diperlukan. 

Lalu apakah Sobat Data bertanya-tanya, apa kegunaan dari Data Cleaning itu sendiri? 

Source : Business 2 Community 

Perlu diketahui bahwa tidak semua data memiliki kualitas yang bersih loh Sobat Data! Sehingga diperlukan proses pembersihan data. Seperti yang telah disebutkan pada #KuliahData sebelumnya, masih ingatkah pada kalimat “Garbage in Garbage Out”?. Jika data yang diproses memiliki kualitas yang kotor, maka hasil analisis juga kurang bagus. Sehingga diperlukan proses Data Cleaning

Berikut adalah keuntungan dari Data Cleaning :  

  1. Menganalisis data menjadi lebih akurat 
  1. Mendorong pengambilan keputusan yang baik 
  1. Meningkatkan efisiensi dalam bekerja 
  1. Meminimalisir error 
  1. Menghilangkan inkonsistensi dan kesalahan yang muncul, dan lain-lain 

Bayangkan Sobat Data sedang menganalisis data pelanggan untuk sebuah toko online. Namun, setelah diperiksa, ditemukan banyak masalah seperti data duplikat, nama pelanggan yang kosong, atau tanggal transaksi yang tidak sesuai format. Jika data ini langsung digunakan tanpa dibersihkan, hasil analisis bisa keliru, yang akhirnya mempengaruhi pengambilan keputusan bisnis loh Sobat Data! 

Lalu bagaimana cara melakukan Data Cleaning? Simak di bawah ini ya Sobat Data! 

Source : Dataedo 

🛠 Langkah-langkah Data Cleaning : 

  1. Menghapus duplikasi data – Menghindari data ganda yang bisa mempengaruhi hasil analisis. 
  1. Menangani data yang hilang (Missing Values) – Mengisi nilai yang kosong dengan rata-rata (mean), median, atau metode lain. 
  1. Memperbaiki format data – Menyesuaikan format tanggal, angka, atau teks agar seragam. 
  1. Menangani outlier – Memeriksa dan memutuskan apakah data yang terlalu jauh dari pola umum perlu dihapus atau tidak. 
  1. Memvalidasi dan mengecek inkonsistensi – Memastikan data sesuai dengan aturan bisnis atau standar yang digunakan. 

Setelah memahami pentingnya Data Cleaning, bagaimana menurut Sobat Data? Apakah pernah menemukan data kotor yang menghambat proses analisis? Yuk, bagikan pengalamanmu di kolom komentar! 

Sampai jumpa di #KuliahData selanjutnya! Teruslah termotivasi dan jangan berhenti mengejar mimpi-mimpimu! 🚀📊 

Yuk segera daftarkan diri kamu di Data Science Telkom University Surabaya dan wujudkan impianmu! 

Playing with Data, Winning the Era. 

More info :  

-Website : https://bds-sby.telkomuniversity.ac.id/ 

-Instagram : https://www.instagram.com/ds.telkomsurabaya/ 

Leave a Reply

Your email address will not be published. Required fields are marked *

Open chat
Ada yang bisa Mindata Bantu?
Hai 👋
Ada yang bisa kami bantu?