Kemudahan berbagai informasi di masa sekarang, membuat data science semakin dikenal. Data science berfungsi untuk mengolah kumpulan data besar baik yang terstruktur atau tidak menjadi informasi, lalu pengetahuan yang berguna untuk mencapai suatu target. Olahan data menjadi kebutuhan utama untuk menciptakan strategi bisnis.
Berdasarkan kebutuhan tersebut, GoTo pada hari Sabtu, 26 Februari 2022, melaksanakan konferensi pertama mengenai Data Science dengan tema “Taking Data Science to New Heights with Communities and Industries”. Secara umum konferensi yang berlangsung selama 2 hari ini membahas mengenai :
- Tools Kausalitas dalam Machine Learning untuk meningkatkan kualitas prediksi dan putusan
- Peran komunitas dalam menaikan level Data Science
- Bagaimana GoTo memanfaatkan Data Science dalam berbagai layanannya
- Kode Generasi pada Pemrograman Kompetitif dengan AlphaCode
Causal Inference, Kunci Utama Machine Learning
Pemanfaatan teknologi informasi oleh masyarakat, menyebabkan tersedianya data yang melimpah. Dalam hal mengolah data, yang menjadi pertanyaan adalah “Bagaimana kita dapat memodelkan, memprediksi, dan mendorong perilaku dan interaksi dalam skala besar lautan data?” Menjawab hal tersebut pembicara tamu, Nicholas Chapados, sebagai VP, AI Research, Service Now, menjelaskan mengenai peran Machine Learning.
Machine Learning telah mengalami perkembangan pesat dalam beberapa tahun terakhir. Progres dari arsitektur deep neural network dan transformer menjadi pendorong utama akselerasi progres tersebut.
Dalam dunia bisnis, pertanyan mengenai prediksi dan kemungkinan sering diajukan untuk menentukan strategi bisnis. Jawaban tersebut dapat diberikan dengan mengolah data melalui Machine Learning. Namun, yang perlu menjadi catatan dalam penggunaan Machine Learning adalah memisahkan antara Kausalitas dan Korelasi. Menerapkan analisis kausalitas dalam data observasi diperlukan untuk menemukan kausalitas (causal discovery) agar terhindar dari konsep bias dan kesimpulan yang salah.
Akselerasi Data Scientist melalui komunitas
Perkembangan dari Data Science juga selaras dengan kebutuhan Sumber Daya Manusia yang ahli pada bidang tersebut. Atas dasar tersebut, diperlukan dukungan dari berbagai pihak untuk dapat mengakselerasi Data Scientist yang kompeten. Dalam konferensi di hari kedua, beberapa komunitas telah memaparkan upaya yang dilakukan untuk memenuhi kebutuhan yang ada.
She Loves Data, yang telah memiliki 17 chapter tersebar di berbagai negara, telah memberikan pelatihan kepada 15000 lebih perempuan dalam rangka mempersiapkan perempuan sebagai penggerak revolusi teknologi dan data. Lebih lanjut, AI Professionals Association juga turut serta dalam memberikan standar kompetensi dalam berbagai level untuk profesi AI dan ML. Terakhir, Yayasan Data Science atau lebih dikenal Data Science Indonesia juga memiliki visi untuk menciptakan ekosistem kolaboratif terkait teknologi data untuk kemajuan bersama.
Data Science dan kepuasan pelanggan GoTo
Dalam rangka komitmen memberikan pelayanan terbaik, GoTo juga telah memanfaatkan data science dalam menghilangkan hambatan yang ada. Salah satu hambatan yang dapat diselesaikan oleh Gojek adalah pengalaman advertising yang tidak efisien karena harga statis. Lebih lanjut Gojek juga berhasil menyediakan rekomendasi makanan yang paling relevan dengan keinginan pengguna. Hasil pencarian tersebut juga dapat dipilah berdasarkan beberapa kategori dan faktor kemiripan.
Mirip dengan tujuan Gojek, Tokopedia juga berhasil mempersonalisasi pengalaman pencarian pelanggan dengan pemanfaatan deep machine learning. Rekomendasi produk berdasarkan hasil pencarian pelanggan tidak hanya terbatas pada konten dan faktor kemiripan, tetapi juga memberikan rekomendasi lanjutan berdasarkan prediksi kebutuhan setelah pencarian produk awal dilakukan.
Rekomendasi yang diberikan oleh Tokopedia pun sangat variatif. Dengan Next Category Prediction Model, Tokopedia dapat memiliki keragaman prediksi, dimana hanya 20,09 % pengguna mendapat rekomendasi produk yang belum pernah mereka beli sebelumnya dan 10,69 % mendapatkan rekomendasi yang belum pernah mereka hubungi sebelumnya.
Hambatan lain baik dari Gojek maupun Tokopedia adalah gambar produk yang di unggah oleh pelaku usaha sering juga tidak sesuai atau pun tidak pantas. Melalui Inappropriate Content Auditor (INCA), GoTo financial dapat memfilter 75% konten-konten tersebut secara otomatis dengan 99% presisi dan menghemat 2.600 jam kerja manusia per bulan.
Alphacode, solusi pada tingkat kompetitif
Walaupun Machine Learning telah mengalami progres yang signifikan dalam menghasilkan dan mengolah data, namun kemajuan dalam pemecahan masalah belum dapat menyelesaikan masalah sederhana pada matematika simpel dan masalah pada programming. DeepMind melalui AlphaCode berupaya untuk menyelesaikan masalah tersebut pada programming tingkatan kompetitif.
Nando de Freitas sebagai Scientis Leading the ML Team Goggle DeepMind, menjelaskan bahwa AlphaCode menggunakan transformer-based language models untuk menghasilkan kode pada skala yang belum pernah terjadi sebelumnya, dan secara cerdas memfilter kode tersebut pada kumpulan kecil program yang menjanjikan. Pada kompetisi programming yang diselenggarakan oleh Codeforces, AlphaCode berhasil menduduki posisi teratas 54% dari peserta.
AlphaCode dikembangkan pada programming kompetitif karena pada level ini diuji kemampuan memahami bahasa yang dapat memberikan progres signifikan untuk AI dalam menerjemahkan, meningkatkan neural architecture, meningkatkan skala dan mengurangi energi yang kita perlukan dalam program ini.
Download pdf di:
Pemaparan lebih lanjut pada Konferensi dapat dilihat pada tautan berikut: