3V Big Data là gì? Tiếp nối chủ đề về Dữ liệu lớn, trong bài viết này Trường sẽ nêu tổng quan về 3 chữ V:
- Volume
- Variety
- Velocity
Dưới đây là phần phân tích chi tiết từng chữ V.
Tuy nhiên, bạn cũng nên biết rằng còn nhiều chữ V khác như Value, Veracity, Visualization,…
Trong báo cáo của Gartner năm 2012, chuyên gia phân tích Doug Laney xác định big data hình thành bởi 3 yếu tố:
- Lượng dữ liệu rất lớn
- Tốc độ dữ liệu vào và ra liên tục và nhanh
- Sự đa dạng của dữ liệu đến mức phức tạp
1. Volume – Top 1 trong 3V big data là gì?
Khi nói đến big data – dữ liệu lớn thì chữ V đầu tiên bạn nên biết đó là Volume (Độ lớn).
Trên thực tế, 90% lượng dữ liệu được tạo ra từ quá khứ tới hiện tại được tạo ra trong 2 năm gần đây. Và theo dự báo trong những năm tới lượng dữ liệu còn tăng gấp nhiều lần. Lượng dữ liệu được tạo ra đến hết năm 2020 sẽ gấp 50 lần lượng dữ liệu được tạo 10 năm trước đó.
- Thực tế là lượng dữ liệu sẽ siêu siêu lớn khi mà IOT ngày càng được ứng dụng rộng rãi hơn với hàng triệu tỉ cảm biến điện tử được sử dụng
- Những chiếc máy bay có thể tạo ra khoảng 2.5 tỉ Terabyte dữ liệu mỗi năm
- Square Kilometer Array Telescope có thể tạo ra 1 Exabyte dữ liệu mỗi ngày
Ngày càng nhiều dữ liệu được tạo ra, lưu trữ và xử lý là nhờ những công nghệ đột phá như điện toán đám mây, bộ siêu vi xử lý…
2. Variety
Theo cách hiểu truyền thống thì dữ liệu (data) được hiểu là dữ liệu có cấu trúc.
Dữ liệu được lưu vào các cột (fields) và các dòng (rows) như trong excel vậy. Tuy nhiên, quan điểm về dữ liệu trong thời đại mới đã mở rộng hơn rất nhiều, nó có thể là:
- Âm thanh
- Hình ảnh
- Video
- Like/ share
- …
Đa số dữ liệu là dữ liệu phi cấu trúc. Điều này khiến cho dữ liệu trở nên quá đa dạng đến mức phức tạp và tốn kém hơn.
3. Velocity
Đây là thuật ngữ quan trọng trong big data, nó đề cập tới tốc độ dữ liệu được:
- Tạo ra
- Lưu trữ
- Xử lý và phân tích
- Hiển thị
Trong quá khứ thì dữ liệu được cập nhật thường xuyên nhưng thời gian phân tích, xử lý và lên báo cáo thường là định kỳ. Có thể là hàng tuần hoặc hàng tháng mới thu thập được đầy đủ dữ liệu phục vụ báo cáo.
Nhưng hiện tại với sự phát triển mạnh mẽ về công nghệ: Lưu trữ online, băng thông internet, tốc độ xử lý của bộ vi xử lý,…
=> Dữ liệu được tạo ra, lưu trữ, phân tích, xử lý gần như/ thậm chí là theo thời gian thực.
Một vài ví dụ về big data – velocity:
- Theo youtube: Mỗi phút có khoảng 100 giờ video được up lên hệ thống
- Mỗi phút có khoảng 200 triệu thư điện tử được gửi đi
- Theo Flickr: Có khoảng 20 triệu bức ảnh được xem và 30 nghìn ảnh được tải lên trang Flickr
- Theo Google: Mỗi phút có khoảng 2.5 triệu lượt try vấn trên toàn hệ thống.
Với bằng đó ví dụ, bạn có thể thấy được lượng dữ liệu được tạo ra nhiều và nhanh như thế nào. Sự thực là dữ liệu được tạo ra theo cấp số nhân với tốc độ chóng mặt.
Do đó, việc biết, hiểu và ứng dụng tốt Big Data sẽ tạo ra lợi thế rất lớn cho bất kỳ doanh nghiệp, tổ chức nào.
Trên đây là cái nhìn tổng quan về 3 V big data là gì. Nếu bạn cần hỗ trợ thêm thông tin gì, bạn đừng ngại chia sẻ nhé.
- Email: Erps.vn@gmail.com
- Hotline: 038 997 8430
Xin cảm ơn,
Trườngpx
CEO ERPS.VN – Công ty chuyên về ERP tại Việt Nam