Sử dụng và quản lý tổng hợp trong Power BI Desktop (Phần 1)

Aggregations (tổng hợp) trong Power BI cho phép bạn giảm kích thước bảng vì thế bạn có thể tập trung vào các dữ liệu quan trọng và cải thiện hiệu suất truy vấn. Tính năng tổng hợp cho phép phân tích tương tác trên dữ liệu lớn theo những cách không thể thực hiện được và có thể giảm đáng kể chi phí mở khóa các bộ dữ liệu lớn để đưa ra quyết định.

Những ưu điểm của tính năng tổng hợp bao gồm:

  • Cải thiện hiệu suất truy vấn với dữ liệu lớn: Mỗi tương tác với trực quan Power BI đều gửi các truy vấn DAX đến tập dữ liệu. Dữ liệu tổng hợp được lưu trong bộ nhớ cache sử dụng một phần nhỏ tài nguyên cần thiết cho dữ liệu chi tiết. Vì thế, bạn có thể mở khóa dữ liệu lớn mà có thể không truy cập được.
  • Làm mới dữ liệu được tối ưu: Kích thước bộ nhớ cache nhỏ hơn làm giảm thời gian làm mới nên dữ liệu đến với người dùng nhanh hơn.
  • Các kiến trúc cân đối: Bộ nhớ đệm trong bộ nhớ Power BI có thể xử lý các truy vấn tổng hợp, hạn chế các truy vấn được gửi trong chế độ DirectQuery và giúp bạn đáp ứng các giới hạn đồng thời. Những truy vấn ở cấp độ chi tiết còn lại có xu hướng được lọc, truy vấn cấp độ giao dịch mà các kho dữ liệu và hệ thống dữ liệu lớn thường xử lý tốt.

Các nguồn dữ liệu thứ nguyên như warehouse và data marts có thể dùng tổng hợp dựa trên các mối quan hệ. Các nguồn dữ liệu lớn dựa trên Hadoop thường tổng hợp dựa trên các cột GroupBy. Bài viết này mô tả sự khác biệt về mô hình Power BI điển hình cho từng loại nguồn dữ liệu.

1. Tạo một bảng tổng hợp

Bước 1: Cài đặt một bảng mới với các trường bạn muốn, điều này còn phụ thuộc vào dữ liệu và model (mô hình).

Bước 2: Xác định các tổng hợp bằng cách sử dụng hộp thoại Manage Aggregations.

Bước 3: Nếu có thể, hãy thay đổi chế độ lưu trữ cho bảng tổng hợp.

2. Quản lý các tổng hợp

Sau khi tạo một bảng mới với các trường mong muốn, trong thanh Fields của bất kỳ Power BI Desktop view, nhấp chuột phải vào bảng và chọn Manage aggregations.

Hộp thoại Manage Aggregation hiển thị một dòng cho mỗi cột trong bảng, nơi bạn có thể chỉ định hành vi tổng hợp. Trong ví dụ dưới đây, các truy vấn đến bảng chi tiết Sales thì được chuyển hướng nội bộ đến bảng tổng hợp Sales Agg.

Trình đơn Summarization trong hộp thoại Manage aggregation cung cấp các giá trị sau:

  • Count
  • GroupBy
  • Max
  • Min
  • Sum
  • Count table rows

Trong ví dụ tổng hợp dựa trên mối quan hệ, các mục nhập GroupBy là tùy chọn. Ngoài trừ, DISTINCTCOUNT, chúng không ảnh hưởng đến hành vi tổng hợp và chủ yếu để dễ đọc. Nếu không có các mục nhập GroupBy, các tổng hợp sẽ vẫn bị tấn công, dựa trên các mối quan hệ. Sau khi đã chọn được loại tổng hợp bạn muốn, nhấn Apply All để hoàn tất.

3. Validations

Hộp thoại Manage aggregation thực thi các xác thực đáng chú ý sau:

  • Detail Column phải có cùng kiểu dữ liệu với Aggregation Column, ngoại trừ Count và Count table rows trong Summarization. Count và Count table rows chỉ hỗ trợ cho các cột tổng hợp số nguyên và không yêu cầu kiểu dữ liệu phù hợp.
  • Tổng hợp theo chuỗi bao gồm ba hoặc nhiều bảng không được phép. Ví dụ, các tổng hợp trên bảng A không thể tham chiếu đến bảng B có các tổng hợp tham chiếu đến bảng C.
  • Tổng hợp trùng lặp, trong đó, hai mục nhập sử dụng cùng một hàm Summarization và tham chiếu đến cùng Detail  Table Detail Column, không được phép.
  • Detail Table phải sử dụng chế độ lưu trữ DirectQuery, không phải Import.

Nhóm theo cột khóa ngoại được dùng bởi một mối quan hệ không hoạt động và dựa vào hàm USERELATIONSHIP để tổng hợp các lần truy cập không được hỗ trợ.

Hầu hết các xác thực được thực thi bằng cách tắt các giá trị thả xuống và hiển thị văn bản giải thích trong chú tooltip, như ảnh sau.

4. Bảng tổng hợp bị ẩn

Người dùng với quyền chỉ đọc truy cập vào tập dữ liệu không thể truy vấn các bảng tổng hợp. Điều này tránh các lo ngại về bảo mật khi được sử dụng với row-level security (RLS). Người dùng và truy vấn đề cập đến bảng chi tiết không phải bảng tổng hợp và không cần biết về bảng tổng hợp.

Vì lý do này, các bảng tổng hợp bị ẩn khỏi view Report. Nếu bảng không bị ẩn, hộp thoại Manage aggregations sẽ đặt nó ẩn khi bạn chọn Apply All.

5. Storage modes

Tính năng tổng hợp tương tác với các chế độ lưu trữ cấp bảng. Bảng Power BI có thể sử dụng các chế độ DirectQuery, Import hoặc Dual Storage. DirectQuery truy vấn trực tiếp phần phụ trợ trong khi Import lưu trữ dữ liệu vào bộ nhớ và gửi truy vấn đến dữ liệu đã lưu trong bộ nhớ cache. Tất cả các nguồn dữ liệu DirectQuery không đa chiều và Power BI Import đều có thể hoạt động với tính năng tổng hợp.

Để đặt chế độ lưu trữ của bảng tổng hợp thành Import nhằm tăng tốc truy vấn, hãy chọn bảng tổng hợp trong Power BI Desktop Model view. Trong ngăn Properties, mở rộng Advanced, thả xuống các lựa chọn trong chế độ Storage và chọn Import. Lưu ý rằng hành động này không thể đảo ngược.

6. RLS cho tổng hợp

Để hoạt động chính xác cho các tổng hợp, biểu thức RLS phải lọc cả bảng tổng hợp và bảng chi tiết.

Trong ví dụ dưới đây, biểu thức RLS trên bảng Geography hoạt động cho các tổng hợp, bởi vì Geography nằm trên lọc các mối quan hệ với cả bảng Sales Sales Agg. Các truy vấn chạm vào bảng tổng hợp và những truy vấn không có RLS đều sẽ được áp dụng thành công.

Một biểu thức RLS trên bảng Product chỉ lọc bảng chi tiết Sales, không lọc bảng tổng hợp Sales Agg. Vì bảng tổng hợp là một biểu diễn khác của dữ liệu trong bảng chi tiết, nên sẽ không an toàn khi trả lời các truy vấn từ bảng tổng hợp nếu bộ lọc RLS không thể áp dụng được. Chỉ lọc bảng chi tiết không được khuyến nghị vì các truy vấn của người dùng từ vai trò này sẽ không được hưởng lợi từ các lần truy cập tổng hợp.

Một biểu thức RLS chỉ lọc bảng tổng hợp Sales Agg và không phải bảng chi tiết Sales không được phép.

Đối với tổng hợp dựa trên các cột GroupBy, biểu thức RLS áp dụng cho bảng chi tiết có thể được dùng để lọc bảng tổng hợp, vì tất cả các cột GroupBy trong bảng tổng hợp đều được bao phủ bởi bảng chi tiết. Mặt khác, bộ lọc RLS trên bảng tổng hợp không thể được áp dụng cho bảng chi tiết, do không được phép.

Trên đây là phần đầu tiên của loạt bài viết về cách sử dụng và quản lý các tổng hợp trong Power BI. Hy vọng rằng những kiến thức được BAC tổng hợp trên đây sẽ hữu ích với bạn đọc. Đừng quên theo dõi các phần tiếp theo sẽ được gửi đến bạn đọc tại website bacs.vn.

Đọc tiếp phần 2 tại đây nhé: Sử dụng và quản lý tổng hợp trong Power BI Desktop (Phần 2)

Nguồn tham khảo:
https://docs.microsoft.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

    Các bài viết liên quan: 

    • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
    • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
    • Tính năng mới trên tableau – verion 2019.1 – click vào đây

    BAC – Biên soạn và tổng hợp nội dung

     

    Previous Post
    Next Post