Halo, Sobat Data!

Selamat datang di #KuliahData! Di sesi ini, Sobat Data akan diajak untuk mengenali berbagai mata kuliah yang ada di Data Science Telkom University Surabaya. Mulai dari pengenalan pemograman, analisis data, dan keterampilan lain yang akan mendukung Sobat Data dalam proses belajar di Data Science Telkom University Surabaya.

Tidak seperti biasanya, pada #KuliahData kali ini, Sobat Data akan diajak mengenal Data Science Lifecycle, sebuah konsep yang akan sangat membantu dalam memahami dan mengelola data, baik dalam perkuliahan maupun di dunia kerja.

Di era digital yang terus berkembang, jumlah data yang dihasilkan semakin melimpah. Jika tidak dikelola dengan baik, data hanya akan menjadi sekadar angka tanpa makna. Oleh karena itu, penting bagi kita untuk memahami bagaimana data diolah agar dapat menghasilkan keputusan yang lebih tepat, menyelesaikan masalah, dan mendapatkan insight berharga.

Dengan memahami alur proses ilmu data, Sobat Data bisa lebih mudah dalam:

  1. Merancang proyek data yang lebih terstruktur.
  2. Meningkatkan kualitas analisis data.
  3. Membantu pengambilan keputusan berbasis data.
  4. Mengoptimalkan pemanfaatan teknologi data science, dan lain-lain.

Nah, bagaimana sebenarnya tahapan dalam Data Science Lifecycle? Yuk, kita bahas lebih lanjut!

Source : Geeks for Geeks

  • Business Understanding

Setiap proyek Sains Data dimulai dari identifikasi dan pemasalahan yang dihadapi. Hal tersebut meliputi identifikasi masalah, penentuan tujuan atau target yang dikomunikasikan dengan stakeholder maupun client sebelum melakukan pengolahan data. Pada tahap ini, bisa ditentukan juga metrik evaluasi untuk mengukur kesuksesan.

  • Data Understanding

Setelah melalui Business Understanding, dilakukan proses pemahaman data meliputi pengumpulan data, memahami setiap kolom yang ada pada dataset, mendeskripsikan data, meninjau kualitas data, feature engineering, dan lain-lain. Data Understanding melibatkan kolaborasi dengan tim bisnis untuk memahami setiap dataset yang ada.

  • Data Preparation

Data Preparation merupakan tahapan yang penting dan krusial dalam pengolahan data, karena tahapan ini yang akan memastikan kualitas data. Seperti kalimat yang Sobat Data sering dengar yaitu “Garbage in Garbage Out”, jika preparation awal kurang bagus, maka hasil yang dikeluarkan juga kurang bagus, begitupun sebaliknya. Sehingga diperlukan Data Preparation yang baik.

Proses pada tahapan ini meliputi, pemilihan data, penggabungan data dari berbagai sumber hingga menjadi satu dataset, pembersihan data, penanganan missing values, identifikasi outlier, pembuatan fitur baru, mengubah format data, dan lain-lain.

  • Exploratory Data Analysis (EDA)

EDA bertujuan untuk mengetahui dan menganalisis pola, tren, dan distribusi pada dataset yang digunakan. Selain itu, EDA digunakan untuk mendeteksi anomali, mencari hubungan antar variabel, perhitungan statistika deskriptif, dan lain-lain.

  • Data Modelling

Data Modelling merupakan inti dari analisis data. Setelah data diproses melalui berbagai tahapan, langkah selanjutnya adalah melakukan pemilihan model yang sesuai. Sobat Data juga harus memastikan dan menyesuaikan antara permasalahan dan model. Model dapat berupa klasifikasi, regresi, dan lain-lain.

Setelah menentukan model, Sobat Data juga harus menentukan algoritma yang akan digunakan. Selanjutnya, dilakukan tuning hyperparamater atau penentuan hyperparameter untuk mendapatkan performa yang optimal. Contoh dari penentuan hyperparameter seperti penentuan jumlah pohon dalam clusterisasi, jumlah kluster pada K-Means, dan lain-lain.

  • Model Evaluation

Tahapan selanjutnya yaitu evaluasi model dengan data yang tidak terlihat dan berdasarkan metrik yang telah dipikirkan sebelumnya.  Evaluasi bertujuan untuk mengetahui performa model, dan jika dirasa performa model kurang, Sobat Data bisa melakukan pengulangan proses hingga menghasilkan evaluasi yang diharapkan.

  • Model Deployment

Model Deployment merupakan tahapan terakhir dalam siklus Sains Data, dimana model yang sudah diproses akan diterapkan dalam struktur dan saluran penerapan. Selain bertujuan mengimplementasikan model, Model Deployment juga diharapkan dapat memberikan solusi dan insight yang dapat membantu perusahaan.

Nah, itulah siklus dalam proses Sains Data. Perlu diketahui bahwa siklus ini tidak selalu berjalan secara berurutan, karena bisa saja ada perulangan yang perlu dilakukan agar hasilnya lebih optimal. Sobat Data juga harus berhati-hati dalam setiap tahapannya untuk memastikan hasil yang akurat dan berkualitas.

Untuk gambaran nyata dari siklus Sains Data, Sobat Data bisa mengunjungi laman artikel berikut terkait jurnal yang telah dibuat oleh Dosen Sains Data Telkom Universitas Surabaya.

https://bds-sby.telkomuniversity.ac.id/mengupas-segmentasi-pasar-pendidikan-tinggi-dengan-k-means-clustering-studi-oleh-dosen-data-science-telkom-university-surabaya-idea/

Sampai jumpa di #KuliahData selanjutnya! Teruslah termotivasi dan jangan berhenti mengejar mimpi-mimpimu! 🚀📊

Yuk segera daftarkan diri kamu di Data Science Telkom University Surabaya dan wujudkan impianmu!

Playing with Data, Winning the Era.

More info :

-Website : https://bds-sby.telkomuniversity.ac.id/

-Instagram : https://www.instagram.com/ds.telkomsurabaya/

Leave a Reply

Your email address will not be published. Required fields are marked *

Open chat
Ada yang bisa Mindata Bantu?
Hai 👋
Ada yang bisa kami bantu?