Hive Là Gì

  -  
Yahoo ban đầu thao tác làm việc cùng với PIG (đang nói sau) cho những tiến hành vận dụng của mình trên Hadoop. Mục tiêu của Yahoo để cai quản dữ liệu không cấu trúc. Tương trường đoản cú, Facebook bước đầu thực hiện các chiến thuật kho tài liệu (warehouse) của mình bên trên Hadoop cùng với HIVE. Lý vị chọn sử dụng HIVE là cũng chính vì các giải pháp kho dữ liệu (warehouse) truền thống khôn cùng đắc.

Bạn đang xem: Hive là gì

HIVE là gì?


*

Hive là hạ tầng kho tài liệu đến Hadoop. Nhiệm vụ chính là hỗ trợ sự tổng vừa lòng dữ liệu, truy hỏi vấn với so sánh. Nó cung cấp phân tích các tập dữ liệu Khủng được lưu lại vào HDFS của Hadoop tương tự như trên Amazon S3. Điểm hay của HIVE là hỗ trợ tầm nã xuất như là SQL cho dữ liệu bao gồm kết cấu, được biết cùng với thương hiệu HiveSQL (hoặc HQL) cũng tương tự so sánh big data cùng với MapReduce. Hive không được chế tạo để trả lời nkhô giòn những câu truy tìm vấn tuy nhiên nó được tạo ra cho các áp dụng khai quật dữ liệu (data mining). Các ứng dụng khai quật dữ liệu có thể mất không ít phút ít cho các giờ đồng hồ nhằm so với tài liệu cùng HIVE được sử dụng hầu hết.

Cách tổ chức của HIVE

Dữ liệu được tổ chức thành 3 định dạng trong HIVE.

Tables: Chúng khôn cùng tương tự nlỗi bảng (tables) trong RDBMS và đựng các cái (rows). Hive chỉ được xếp lớp bên trên HDFS, cho nên vì thế tables được ánh xạ thẳng vào các thỏng mục của khối hệ thống tập tin. Nó cũng cung cấp các tables được lưu giữ trên các khối hệ thống tập tin không giống.

Partitions: Hive sầu tables hoàn toàn có thể có không ít rộng 1 partition. Chúng được ánh xạ cùng với những tlỗi mục nhỏ với các khối hệ thống tập tin.

Xem thêm: " Gia Trưởng Tiếng Anh Là Gì ? Dịch Sang Tiếng Anh Gia Trưởng Là Gì

Buckets: Trong Hive, dữ liệu rất có thể được phân thành những buckets. Buckets được lưu trữ nlỗi các tập tin trong partition vào hệ thống tập tin.

Hive sầu cũng có metastore để lưu toàn bộ metadata. Nó là DataBase quan hệ nam nữ đựng ban bố khác nhau liên quan cho Hive Schema (column types, owners, key-value data, statistics,…). Chúng ta hoàn toàn có thể cần sử dụng MySquốc lộ mang đến vấn đề này.


*

*

HiveSQL (HQL) là gì?

Ngôn ngữ truy nã vấn Hive sầu cung ứng những toán thù tử cơ phiên bản như thể SQL. Đây là một số tác vụ mà lại Hquốc lộ rất có thể có tác dụng thuận tiện.

Xem thêm: Tin Tức Game Online Mới Ra Hôm Nay, Game Mới Ra Mắt Cực Đỉnh!

Tạo với thống trị tables với partitions.Hỗ trợ những toán thù tử Relational, Arithmetic với Logical khác nhau.Evaluate functionsTải về câu chữ 1 table từ thỏng mục cục bộ hoặc tác dụng của câu tầm nã vấn mang lại thư mục HDFS.

Đây là ví dụ truy nã vấn HQL:

SELECT upper(name), salesprice FROM sales; SELECT category, count(1) FROM products GROUP BY category;