Karakteristik Big Data

Topics : An Insight, Data Management & Warehouse

Sebelum melangkah pada System Integrasi, kita perlu mengenal kerakteristik Big Data. Big Data memiliki 5 karakteristik penting yang harus dipahami. Berikut karakteristik Big Data:

1. Data Lebih Banyak

Random sampling pada Small Data sebenarnya adalah alternatif dari mengumpulkan dan menganalisis dataset penuh, karena keterbatasan teknologi dan kapasitas penyimpanan. Kelemahannya adalah sampling membutuhkan perencanaan dan eksekusi yang hati-hati serta bekerja dalam subset membantu perusahaan meadapat apa yang dicari lebih cepat dan murah tetapi melewatkan pertanyaan yang tidak terpikirkan sebelumnya.

Big Data sebagai meruapakan keseluruhan informasi, namun ukurannya data sendiri tidak melulu besar. Contahnya saat terngukapnya kecurangan pertandingan sumo di Jepang. Data yang digunakan bukan sampel, tapi N=all. Setelah mengumpulkan data 64.000 pertandingan selama 11 tahun terakhir, ternyata data tersebut hanya berukura sama dengan file foto digital. Dengan prisip N=all diperoleh suatu pola yang menunjukan baha pesumo yang lebih membutuhkan kemenangan memiliki peluang 25% lebih besar untuk menang.

2. Berantakan (Messy)

Big data meciptakan dataset yang lebih berantakan, namun mampu memberikan gamberab yang lebih menyeluruh, meskipun tidak terstruktur. Contohnya Google Translate, perusahaan yang bermarkas di Mountain View, California, AS ini mengumpulkan seluruh dokumen dengan terjemahan yang mereka bisa kumpulkan dengan kualitas yang berbeda-beda. Data yang dikumpulkan memang berantakan namun terjemahan yang dihasilkan lebih akurat daripada sistem yang lebih berdasarkan alogaritma, dan jauh lebih kaya (meliputi 60 bahasa).

3. Korelasi

Big Data sering memprediksi berdasarkan korelasi, ketimbang hungungan sebeb akibat. Contoh, pada awalnya Amazon.com mengandalkan review dari suatu tim ahli “The Amazon Voice”. Kemudian mereka menggunakan rekomendasi yang dihasilkan dari personalisasi penjualan produk (pelangga yang memberi produk A cenderung membeli produk B maka juka pelanggan lain membeli produk A, Amazon akan merekomendasikan produk B). Kini sepertiga penjualan Amazon diperoleh dari penawaran produk ke user dari hasil rekomendasi berdasarkan personalisasi.

4. Datafikasi

Mendatafikasi suatu fenomena adalah menyimpannya dalam format yang terkuantifikasi agar bisa ditabulasi dan dianalisis serta menangkap informasi dan menyimpannya dalam format data yang memudahkannya untuk digunakan kembali. Memindahkan data ke bentuk digital belum tentu mendatafikasi.

5. Value

Mengumpulkan data adalah hal yang krusial namun tidak cukup karena kebanyakan nilai dari data terletak pada penggunaan, bukan kepemilikan. Dalam era Big Data, seluruh data akan dianggap berharga, bahkan data paling menda dan sepele. Tidak seperti sumber daya lain, nilai data tidak berkurang setelah digunakan. Biaya petimpanan digital telah berkurang setengahnya setiap dua tahun, sementara storage density meningkat 50 juta kali dalam 50 tahun terakhir.(**)