Pengertian Big Data

image

Big data adalah sebuah data elektronik yang sangat besar, yang mempunyai banyak macam jenis dan data elektronik ini sangat cepat berubah. Big data saat ini banyak di gunakan orang-orang untuk membantu kebutuhan. Banyak sekali data yang tersebar dan tersimpan di komputer-komputer di internet misalnya seperti teks, gambar,video, suara, animasi, blog, buku, cuaca, GPS, temperatur, dan masih banyak lagi jenis nya.
Banyak orang yang menggunakan big data ini untuk mencari informasi yang sedang populer saat ini, misal nya berita terbaru. Misalnya facebook, di facebook kita bisa menemui banyak orang, bahkan teman lama yang sama-sama menggunakan facebook. Untuk mengolah Big Data menjadi informasi yang lebih berguna, perlu program “big” yang artinya bukan program “biasa”. Jika data konvensional selama ini hanya berisi teks dan angka biasa seperti data keuangan, maka cukup diolah dengan database biasa pula, misal MS Access, MS SQL Server, dan lain-lain yang selama ini hanya untuk mengolah data terstruktur. Big Data tidak dapat diolah hanya dengan program database konvensional yang disebut SQL (Structured Query Language) atau RDBMS (Relational Database Management System). Big Data membutuhkan program database yang mendukung NoSQL (Not only SQL), yang mampu mengolah data tidak terstruktur. Dalam bahasa Inggris, Big Data terkait dengan 3V, yakni Volume (ukuran data sangat besar), Velocity (kecepatan transfer/perubahan data sangat tinggi), dan Variety (variasi atau jenis data sangat banyak). Ada juga yang menjadikan 4V, ditambah Value, karena sangat besarnya nilai bisnis yang dihasilkan, sehingga menjadi besar pula peluang kerja bagi profesional di bidang pemrograman komputer, pengolahan data statitisk, dan Cloud Computing. Kebutuhan SDM di bidang Big Data pada 2015 ini diproyeksi sekitar 4,4 juta orang. Di Amerika saja butuh 190.000 orang pada 2011 dan akan tambah butuh lagi 490.000 pada 2018 (Sumber: McKinsey Global Institute, 2011) Dimensi -Dimensi Big Data Ada 3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan Velocity 1.    Volume ·         Mengubah 12 terabyte Tweet dibuat setiap hari ke dalam peningkatan sentimen analisis produk. ·         Mengkonvert 350 milliar pembacaan tahunan untuk lebih baik dalam memprediksi kemampuan beli pasar. Volume data juga terus meningkat sehingga tidak dapat diprediksi jumlah pasti dan juga ukuran dari data sekitar lebih kecil dari petabyte sampai zetabyte. Dataset big data sekitar 1 terabyte sampai 1 petabyte perperusahaan jadi jika big data digabungkan dalam sebuah organisasi / group perusahaan ukurannya mungkin bisa sampai zetabyte dan jika hari ini jumlah data sampai 1000 zetabyte, besok pasti akan lebih tinggi dari 1000 zetabyte. 2. Variety Volume data yang banyak tersebut bertambah dengan kecepatan yang begitu cepat sehingga sulit bagi kita untuk mengelola hal tersebut. Kadang-kadang 2 menit sudah menjadi terlambat. Untuk proses dalam waktu sensitif seperti penangkapan penipuan, data yang besar harus digunakan sebagai aliran ke dalam perusahaan Anda untuk memaksimalkan nilainya. ·         Meneliti 5 juta transaksi yang dibuat setiap hari untuk mengidentifikasi potensi penipuan ·         Menganalisis 500 juta detail catatan panggilan setiap hari secara real-time untuk memprediksi gejolak pelanggan lebih cepat.
Berbagai jenis data dan sumber data. Variasi adalah tentang mengelolah kompleksitas beberapa jenis data, termasuk structured data, unstructured data dan semi-structured data. Organisasi perlu mengintegrasikan dan menganalisis data dari array yang kompleks dari kedua sumber informasi Traditional dan non traditional informasi, dari dalam dan luar perusahaan. Dengan begitu banyaknya sensor, perangkat pintar (smart device) dan teknologi kolaborasi sosial, data yang dihasilkan dalam bentuk yang tak terhitung jumlahnya,  termasuk text, web data, tweet, sensor data, audio, video, click stream, log file dan banyak lagi. 3. Velocity : Big Data adalah setiap jenis data – data baik yang terstruktur maupun tidak terstruktur seperti teks, data sensor, audio, video, klik stream, file log dan banyak lagi. Wawasan baru ditemukan ketika menganalisis kedua jenis data ini bersama-sama. ·         Memantau 100 video masukan langsung dari kamera pengintai untuk menargetkan tempat tujuan. ·         Mengeksploitasi 80% perkembangan data dalam gambar, video, dan dokumen untuk meningkatkan kepuasan pelanggan.
Data dalam gerak. Kecepatan di mana data dibuat, diolah dan dianalisis terus menerus. Berkontribusi untuk kecepatan yang lebih tinggi adalah sifat penciptaan data secara real-time, serta kebutuhan untuk memasukkan streaming data ke dalam proses bisnis dan dalam pengambilan keputusan. Dampak Velocity latency, jeda waktu antara saat data dibuat atau data  yang ditangkap, dan ketika itu juga dapat diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan yang mustahil untuk sistem tradisional untuk menangkap, menyimpan dan menganalisis. Jenis tertentu dari data harus dianalisis secara real time untuk menjadi nilai bagi bisnis. Untuk mendalami Big Data, program dan istilah berikut ini perlu dipelajari, meskipun tidak harus semuanya, yakni sistem operasi Linux, Apache Hadoop, Apache HBase, MongoDB, MapReduce, HDFS (Hadoop Distributed File System), bahasa pemrograman Java, Hive, Pig, Python, R, dan Cloud. Teknologi Cloud dibutuhkan karena Big Data perlu didukung server yang kuat dengan tempat penyimpanan besar dan mudah dikembangkan. Cloud telah lebih dahulu berkembang dan tersedia luas dengan biaya lebih murah daripada tidak menggunakan Cloud.

Pengertian Analisis Big Data

Untuk mengerti definisi analisis big data, kita tidak bisa lepas dari memahami apa itu big data dan apa itu analisis data. Istilah big data telah saya bahas khusus pada artikel berikut ini, namun saya akan coba berikan overview singkat tentang big data disini.
Big Data merupakan istilah untuk menggambarkan data set yang besar baik StructuredSemi-Structured maupun Unstructured data. Berikut ini tiga jenis format data : 1.            Structured data seperti relational database (RDBMS) 2.            Semi-Structured data seperti XML, JSON 3.            Unstructured data seperti Dokumen, metadata, video, gambar, audio, file teks, ebooks, email message, social media, jurnal dll.
Analisis data adalah proses meneliti data untuk mengetahui pola tersembunyi, korelasi yang belum diketahui, dan informasai berguna lainnya.
Dengan demikian pengertian Analisis Big Data adalah proses meneliti, mengolah data set besar (Big Data) untuk mengetahui pola tersembunyi, korelasi yang tidak diketahui, tren pasar, preferensi pelanggan dan informasi bisnis berguna lainnya.
Jika ingin lebih legkap bisa membaca dari link Wiki berikut ini : Big Data dan  Analisis, Perlu fokus lebih untuk dapat memahaminya ;)

Thu, 5 Oct 2017 @11:34

Copyright © 2019 PT. BINA MANAJEMEN GLOBAL · All Rights Reserved
powered by sitekno