Breaking News
Loading...
27/05/2013

Big Data là gì?


Một bài viết về khái niệm Big Data trên trang IBM.

Big data có thể là một trong các dạng sau:
  • Dữ liệu giao dịch lưu trong các transactional database
  • Những bài post của ta lên các trang mạng xã hội như Facebook, Twitter
  • Dữ liệu kỹ thuật số như picture và video
  • Tín hiệu GPS của điện thoại di động.
  • Dữ liệu email
Người ta đang có nhu cầu phân tích những dữ liệu này, để nhìn thấy những 'giá trị' ẩn bên trong nó. Có nhiều giải pháp đáp ứng nhu cầu này như Angoss Software, IBM, KXEN, Oracle, Revolution Analytics, Salford Systems, SAP, SAS, StatSoft, and Tibco Software.

Microsoft cũng đã tiếp cận thị trường này bằng cách tích hợp Hadoop vào Windows, gọi là HDInsight.

Để làm quen với Hadoop và Big Data, trước tiên ta phải hiểu các thuật ngữ như: Apache Hadoop, MapReduce, HDFS and Hive.
Xem link sau:
http://azure.microsoft.com/en-us/documentation/articles/hdinsight-get-started/

Có 4 dimension cho Big Data, tất cả điều bắt đầu bằng chữ V.
  1. Volumn
  2. Velocity
  3. Variety
  4. Veracity

0 comments:

Post a Comment

 
Toggle Footer