Welcome to my blog!
Data scientist, R and Python programmer, and all-terrain distance runner 🏃♂️
I share my insights and experiences 💡 on using data to solve problems, building data-driven applications, and staying fit and healthy 💪
Welcome to my blog!
Data scientist, R and Python programmer, and all-terrain distance runner 🏃♂️
I share my insights and experiences 💡 on using data to solve problems, building data-driven applications, and staying fit and healthy 💪
GPS eXchange, atau disingkat GPX, merupakan format file untuk menyimpan dan bertukar data lintasan, rute dan lokasi. Kehadiran GPX menjadi krusial dalam merencanakan, melacak, dan merekam aktivitas outdoor seperti lari, bersepeda dan hiking dengan menyediakan data koordinat geografis yang dapat dieksplorasi untuk mendapatkan wawasan yang lebih mendalam terkait rute, jarak, dan elevasi. Dengan menggunakan R, kita dapat mengolah data GPX tersebut dan menghasilkan visualisasi yang informatif. Pada artikel ini akan dibahas bagaimana mengolah data GPX secara sederhana menggunakan R, yaitu...
Sebagai pelari, salah satu grafik favorit saya di Strava adalah workout analysis yang sangat berguna untuk mengevaluasi latihan kecepatan, seperti interval, tempo, fartlek dan sejenisnya. Grafik ini sebetulnya adalah diagram batang atau bar chart yang menampilkan pace (menit per kilometer) untuk setiap split/lap. Hanya saja, bar chart ini sedikit dimodifikasi sedemikian rupa, lebar dari batang bervariasi sesuai dengan panjang/pendeknya split (berdasarkan waktu atau jarak). Contohnya workout analysis dari salah satu latihan dengan menu:...
Aktivitas apa yang biasa dilakukan oleh data scientist terhadap data tabular? Barangkali menghapus kolom atau baris, melakukan transformasi untuk menambahkan kolom baru atau melakukan agregasi. Aktivitas-aktivitas tersebut sering disebut sebagai data wrangling (The OHI Team 2019) atau manipulasi data (dalam konitasi positif) yang bertujuan untuk mengubah data menjadi format yang lebih mudah digunakan atau mudah dipahami. Manipulasi data menjadi bagian tidak diterpisahkan dalam persiapan data yang umumnya membutuhkan waktu paling lama dari keseluruhan rangkaian analisis data....
Data spasial merupakan data yang merepresentasikan gambaran kejadian di permukaan bumi yang disajikan dalam bentuk peta, grafik dan gambar berformat digital. Data spasial tidak hanya terdiri dari baris dan kolom seperti data tabular pada umumnya, tetapi juga mencakup informasi geometris objek seperti titik (koordinat), garis, dan poligon atau area. Format yang paling umum digunakan untuk data spasial adalah shapefiles yang dikembangkan oleh ESRI. Format lain yang bisa dipakai antara lain GeoJSON dan GeoPackage....
Web scraping adalah proses pengambilan data dari halaman web secara otomatis menggunakan kode atau perintah tertentu. Data yang diambil dapat berupa teks, gambar, atau format data lainnya. Web scraping dapat digunakan untuk berbagai tujuan, seperti mengumpulkan data untuk penelitian, analisis, atau pengembangan produk. Teknik web scraping yang paling sering digunakan adalah dengan memanfaatkan HTML parser untuk mengakses dan memanipulasi DOM (Document Object Model) dari halaman HTML. DOM adalah representasi abstrak dari halaman HTML dalam bentuk objek....