Istilah Big Data saat ini masih terbilang baru dan sering disebut sebagai tindakan pengumpulan dan penyimpanan informasi yang besar untuk proses analisis. Fenomena Big Data, dimulai pada tahun 2000-an ketika seorang analis industri Doug Laney menyampaikan konsep Big Data yang terdiri dari tiga bagian penting yaitu volume, kecepatan dan variasi. Tepat pada tanggal 4 September 2018 Fakultas Ilmu Komputer mengadakan Workshop Big Data and Analytics dengan mengundang narasumber Sharat Chandra Manikonda dari India.

Dalam Workshop tersebut narasumber menjelaskan tentang pemanfaatan dan penggunaan Big Data pada bidang industri dan perusahaan besar. pada pertemuan tersebut beliau memberikan materi dengan dibagi menjadi 2 Topic diantaranya sebagai berikut :

Topic 1 :

Web Extraction & Text Mining using R

Key benefit / takeaways :

  1. Hands on R & R Studio basic commands
  2. Demonstration of web page extraction
  3. Hands-on using Twitter tweet extraction

Topic 2 :

Clustering using Spark

Key benefit takeaways :

  1. Understand Spark architecture & distributed computing
  2. Intriduction to Programming languages – spark
  3. Learn about how to create different segments
  4. Use Spark MLib to write programs for clustering