Sebanyak 55% profesional Big Data dari Fortune 100 telah ikut menghadiri pelatihan Cloudera secara langsung. Dan menurut Taneja Group, lebih dari 3000 praktisi IT menggunakan Spark bersama dengan komponen hadoop lainnya.
Mempelajari Cloudera adalah cara yang tepat untuk memulai mempelajari Hadoop.
Beberapa kelebihan Cloudera lainnya:
Cloudera berfokus untuk mendorong perusahaan untuk menggunakan Apache Spark untuk beberapa use case seperti data processing (ETL), real-rime processing, data science, dan machine learning. Spark telah menjadi mesin pengolahan secara de factountuk Hadoop dan mesin umum untuk kasus penggunaan analitik modern.
Silabus:
- Pengenalan Apache Hadoop dan ekosistemnya
- Instalasi Cloudera Manager
- Importing Relational Data dengan menggunakan Apache Sqoop
- Pengenalan dasar Apache Spark
- Bekerja dengan RDD
- Membuat dan mengkonfigurasi aplikasi Apache Spark
- Proses paralel dalam Apache Spark
- Pola umum dalam Apache Spark Data Processing
- DataFrames and Apache Spark SQL
- Message Processing dengan Apache Kafka
- Capturing data dengan menggunakan Apache Flume
- Integrasi Apache Kafka dan Apache Flume
Outcome yang akan diperoleh:
- Mengenal ekosistem Hadoop
- Mengenal cara kerja dan fungsi-fungsi daemon pada Hadoop
- Mengoperasikan Hadoop dengan command line
- Mengenal cara instalasi Cloudera Manager
- Mengoperasikan Sqoop untuk keperluan transfer data dari RDBMS ke Big Data Environment
- Mengenal Apache Spark
- Membuat aplikasi Big Data Analytic sederhana dengan Apache Spark
- Menggunakan Apache Kafka dan Apache Flume
- Memperoleh hasil test sertifikasi Big Data Developer Sharing Vision
- Langkah persiapan menuju test sertifikasi CCA 175 (CCA Spark and Hadoop Developer)
Metode penyampaian:
Penjelasan oleh instruktur berpengalaman dan hands-on langsung di PC.