Đây là phần cuối cùng trong loạt bài viết về sử dụng và quản lý tổng hợp trong Power BI Desktop. Bạn có thể xem lại các phần trước ngay dưới đây để không bỏ lỡ các kiến thức quan trọng về Power BI.
Tham khảo:
- Sử dụng và quản lý tổng hợp trong Power BI Desktop (Phần 1)
- Sử dụng và quản lý tổng hợp trong Power BI Desktop (Phần 2)
- Sử dụng và quản lý tổng hợp trong Power BI Desktop (Phần 3)
1. Ưu tiên tổng hợp
Ưu tiên tổng hợp cho phép nhiều bảng tổng hợp được xem xét bởi một truy vấn con.
Ví dụ dưới đây là một mô hình tổng hợp chứa nhiều nguồn:
- Bảng DirectQuery của Driver Activity chứa hơn một nghìn tỷ dòng dữ liệu IoT có nguồn gốc từ hệ thống big-data. Nó phục vụ các truy vấn xuyên suốt để xem các IoT riêng lẻ trong ngữ cảnh bộ lọc được kiểm soát.
- Bảng Driver Activity Agg là một bảng tổng hợp trung gian trong chế độ DirectQuery. Nó chứa hơn một tỷ hàng trong Azure SQL Warehouse và được tối ưu tại nguồn bằng cách sử dụng các chỉ mục columnstore.
- Bảng Driver Activity Agg2 Import ở một cấp độ chi tiết cao, bởi vì các thuộc tính theo nhóm rất ít và số lượng thấp. Số lượng các dòng có thể lên đến hàng nghìn, vì vậy nó có thể dễ dàng vừa với bộ nhớ đệm trong bộ nhớ. Các thuộc tính này tình cờ được sử dụng bởi một bảng điều hành cấp cao, vì vậy các truy vấn đề cập đến chúng phải nhanh nhất có thể.
Lưu ý: Các bảng tổng hợp DirectQuery sử dụng một nguồn dữ liệu khác nhau từ bảng chi tiết chỉ được hỗ trợ nếu bảng tổng hợp là một SQL Server, Azure SQL hoặc nguồnAzure SQL Data Warehouse.
Dấu bộ nhớ của mô hình này tương đối nhỏ nhưng nó lại mở ra một tập dữ liệu lớn. Nó đại diện cho một kiến trúc cân bằng vì nó trải rộng tải truy vấn qua các thành phần của kiến trúc, sử dụng dựa trên thế mạnh của chúng.
Hộp thoại Manage aggregations cho Driver Activity Agg2 đặt trường Precedence (ưu tiên) là 10, cao hơn Driver Activity Agg. Cài đặt ưu tiên cao hơn có nghĩa là các truy vấn sử dụng tổng hợp sẽ xem xét Driver Activity Agg2 đầu tiên. Thay vào đó, các truy vấn con không ở mức chi tiết mà Driver Activity Agg2 có thể trả lời sẽ xem xét Driver Activity Agg. Các truy vấn chi tiết mà bảng tổng hợp không thể trả lời được sẽ được chuyển hướng đến Driver Activity.
Bảng được chỉ định trong cột Detail Table là Driver Activity, không phải Driver Activity Agg, bởi vì không được phép tổng hợp theo chiều.
Bảng dưới đây biểu diễn các tổng hợp cho bảng Driver Activity Agg2.
2. Phát hiện truy vấn đạt hoặc bỏ sót tổng hợp
SQL Profiler có thể phát hiện các truy vấn được trả về từ công cụ lưu trữ bộ nhớ đệm hoặc được đẩy đến nguồn dữ liệu bởi DirectQuery. Bạn có thể sử dụng cùng một quy trình để phát hiện xem liệu các tổng hợp có đang bị tấn công hay không.
SQL Profiler cũng cung cấp sự kiện mở rộng Query Processing\Aggregate Table Rewrite Query.
Đoạn mã JSON dưới đây cho thấy một ví dụ về đầu ra của sự kiện khi một tập hợp được sử dụng.
- matchingResult cho biết truy vấn con đã sử dụng một tập hợp.
- dataRequest cho biết các cột được GroupBy và cột tổng hợp mà truy vấn con sử dụng.
- mapping cho biết các cột trong bảng tổng hợp được ánh xạ tới.
3. Đồng bộ hóa bộ nhớ đệm
Các tổng hợp kết hợp các chế độ lưu trữ DirectQuery, Import và Dual có thể trả về các dữ liệu khác nhau trừ khi bộ nhớ đệm trong bộ nhớ đươc giữ đồng bộ với nguồn dữ liệu. Ví dụ, thực thi truy vấn sẽ không che giấu các vấn đề dữ liệu bằng cách lọc kết quả DirectQuery để khớp với các giá trị được lưu trong bộ nhớ cache.
Có những kỹ thuật được thiết lập để xử lý các vấn đề như trên tại nguồn nếu cần thiết. Tối ưu hóa hiệu suất chỉ nên được dùng theo những cách không ảnh hưởng đến khả năng đáp ứng các yêu cầu kinh doanh của bạn. Bạn có trách nhiệm biết các luồng dữ liệu của mình và thiết kế phù hợp.
Mong rằng qua loạt bài viết về sử dụng và quản lý tổng hợp trong Power BI Desktop này, bạn đọc đã có được những thông tin hữu ích. Các bạn quan tâm đến chủ đề phân tích dữ liệu nói chung và Power BI nói riêng, hãy tham gia ngay khóa học Power BI tại BAC. Khóa học được thiết kế phù hợp nhiều đối tượng, đi từ cơ bản đến nâng cao và ứng dụng trong các dự án thực tế.
Nguồn tham khảo:
https://docs.microsoft.com/
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung