Qua phần đầu tiên, BAC đã giới thiệu đến bạn đọc 3 chế độ kết nối dữ liệu trong Power BI. Trong đó, DirectQuery được xem là chế độ được phát triển trong tương lai. Tiếp tục với nội dung lần này, chúng ta sẽ khám phá khi nào nên sử dụng DirectQuery.
1. Khi nào dùng DirectQuery thì hữu dụng
Dưới đây là mô tả các tình huống mà trong đó kết nối với DirectQuery có thể đặc biệt hữu ích. Nó bao gồm các trường hợp để dữ liệu trong nguồn gốc sẽ được xem là có lợi. Phần Description sẽ thảo luận về việc liệu kịch bản được chỉ định có khả dụng trong Power BI hay không.
- Limitation (giới hạn): Dữ liệu được thay đổi thường xuyên và cần báo cáo gần với thời gian thực.
-
Description (mô tả): Các models (mô hình) với dữ liệu được import (nhúng) có thể được làm mới tối đa một lần mỗi giờ (nhiều hơn với Power BI Pro hoặc Power BI Premium). Nếu dữ liệu liên tục thay đổi và báo cáo cần phải hiển thị dữ liệu mới theo lịch có thể không đáp ứng được những nhu cầu đó. Bạn có thể truyền dữ liệu trực tiếp vào Power BI, mặc dù, có những giới hạn về khối lượng dữ liệu được hỗ trợ cho trường hợp này.
Ngược lại, sử dụng DirectQuery có nghĩa là việc mở hoặc làm mới một báo cáo hoặc trang tổng quan luôn hiển thị dữ liệu mới nhất trong nguồn. Ngoài ra, các dashboard tiles có thể được cập nhật thường xuyên hơn 15 phút một lần.
- Limitation: Dữ liệu quá lớn.
-
Description: Nếu dữ liệu quá lớn, nó sẽ không thể nhúng tất cả. Ngược lại DirectQuery không yêu cầu chuyển nhiều dữ liệu vì nó được truy vấn tại chỗ.
Tuy nhiên, dữ liệu lớn cũng có thể ngụ ý rằng hiệu suất của các truy vấn đối với nguồn cơ bản đó quá chậm. Không phải lúc nào bạn cũng nhúng toàn bộ dữ liệu chi tiết. Thay vào đó, dữ liệu có thể tổng hợp trước trong quá trình nhúng. Query Editor giúp dễ dàng tổng hợp trước trong quá trình nhập. Có thể nhúng chính xác dữ liệu tổng hợp cần thiết cho mỗi trực quan trong. Mặc dù, DirectQuery là cách tiếp cận đơn giản nhất với dữ liệu lớn, việc nhập dữ liệu tổng hợp có thể được ra giải pháp nếu nguồn bên dưới quá chậm. - Limitation: Các quy tắc bảo mật được xác định trong nguồn cơ bản.
-
Description: Khi dữ liệu được nhúng, Power BI kết nối đến nguồn dữ liệu bằng thông tin đăng nhập của người dùng hiện tại tự Power BI Desktop hoặc thông tin đăng nhập được xác định là một phần của cấu hình làm mới theo lịch trình từ Power BI service. Khi xuất bản và chia sẻ báo cáo như vậy với dữ liệu ở chế độ import, hãy cần thận chỉ chia sẻ với những người dùng được phép xem cùng một dữ liệu hoặc xác định bảo mật cấp hàng như một phần của dataset.
DirectQuery cho phép thông tin đăng nhập của người xem báo cao được chuyển tới nguồn cơ bản và các quy tắc bảo mật được áp dụng ở đó. Đăng nhập một lần được hỗ trợ đối với nguồn dữ liệu SQL Azure và thông qua cổng dữ liệu đến máy chủ SQL tại chỗ. - Limitation: Áp dụng các hạn chế về chủ quyền dữ liệu.
-
Description: Một số tổ chức có các chính sách về chủ quyền dữ liệu, nghĩa là dữ liệu không được rời khỏi cơ sở của tổ chức. Một giải pháp dựa trên nhập khẩu sẽ trình bày rõ ràng cách vấn đề. Ngược lại, với DirectQuery, dữ liệu đó vẫn nằm trong nguồn cơ bản.
Tuy nhiên, thậm chí với DirectQuery, một số caches (bộ nhớ đệm) dữ liệu ở cấp độ trực quan vẫn được lưu giữ trong Power BI service vì làm mới các tiles theo lịch trình. - Limitation: Nguồn dữ liệu cơ bản là nguồn OLAP, chứa các measures.
-
Description: Nếu nguồn dữ liệu cơ bản chứa các measures như SAP, HANA hoặc SAP Business Warehouse, thì việc nhúng dữ liệu sẽ gây ra các vấn đề khác. Nó có nghĩa là dữ liệu được nhúng ở một cấp độ tổng hợp cụ thể, như xác định bởi truy vấn. Ví dụ, measures TotalSales by Class, Year và City. Sau đó, nếu một trực quan được xây dựng yêu cầu dữ liệu ở mức tổng hợp cao hơn, như TotalSales by Year, thì nó sẽ tổng hợp thêm giá trị tổng hợp. Việc tổng hợp này phù hợp với các measures phụ như Sum và Min nhưng đó là vấn đề đối với các measure như Average, DistinctCount.
Để dễ dàng nhận được dữ liệu tổng hợp chính xác, nếu cần cho trực quan cụ thể, trực tiếp từ nguồn, cần phải gửi các truy vấn cho mỗi trực quan như trong DirectQuery. Khi kết nối với SAP Business Warehouse (BW), việc chọn DirectQuery cho phép xử lý các measures này.
Tuy nhiên, hiện DirectQuery qua SAP HANA xử lý nó giống như một nguồn liên kết và cung cấp xử lý tương tự để nhúng.
Tóm lại, với khả năng hiện tại của DirectQuery trong Power BI, nó cung cấp các lợi ích trong những trường hợp sau:
- Dữ liệu thay đổi thường xuyên và cần báo cáo gần với thời gian thực.
- Xử lý dữ liệu lớn mà không cần tổng hợp trước.
- Áp dụng các hạn chế về chủ quyền dữ liệu.
- Nguồn là nguồn đa chiều (multidimensional) chứa các measures như SAP BW.
Các chi tiết trong danh sách trước liên kết đến việc chỉ sử dụng một mình Power BI. Thay vào đó, bạn có thể dùng một mô hình SQL Server Analysis Services hoặc Azure Analysis Services để import dữ liệu. Sau đó, sử dụng Power BI để kết nối đến mô hình đó. Mặc dù cách tiếp cận đó cần cấu hình bổ sung nhưng nó cung cấp tính linh hoạt cao hơn. Nhiều khối dữ liệu lớn hơn có thể được import và không có hạn chế về tần suất dữ liệu được làm mới.
Trên đây là những trường hợp mà việc sử dụng DirectQuery trở nên hữu ích và chi tiết về từng trường hợp. Bạn không cần ghi nhớ tất cả nhưng hãy lưu ý các trường hợp trên vì chắc chắn bạn sẽ cần đến DirectQuery nếu muốn trực quan dữ liệu bằng Power Bi. Đừng quên đón đọc phần tiếp theo tại website bacs.vn để không bỏ lỡ những kiến thức quan trọng.
Nguồn tham khảo:
Đọc tiếp phần 3 tại đây nhé: Giới thiệu về cách sử dụng DirectQuery trong Power BI (Phần 3)
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung