Với Power BI Desktop, khi bạn kết nối với nguồn dữ liệu của mình, bạn luôn có thể nhập bản sao dữ liệu vào Power BI Desktop. Đối với một số nguồn dữ liệu, có một phương pháp thay thế đó là kết nối trực tiếp bằng DirectQuery. Bạn có thể tham khảo danh sách các nguồn dữ liệu được hỗ trợ tại đây.

1. Cách kết nối bằng DirectQuery

Khi bạn sử dụng Get Data để kết nối với một nguồn dữ liệu được hỗ trợ DirectQuery, hộp thoại kết nối sẽ cho phép bạn chọn cách bạn muốn kết nối. Ví dụ, trong Power BI Desktop, bên dưới tab Home, chọn Get Data > SQL Server. Trong hộp thoại SQL Server Database, có hai tùy chọn tại Data Connectivity mode là Import và DirectQuery:

  • Import: Các bảng và cột được chọn sẽ được nhúng vào Power BI Desktop. Khi bạn tạo hoặc tương tác với một trực quan, Power BI sẽ sử dụng dữ liệu được nhúng. Để xem các thay đổi dữ liệu cơ bản kể từ lần nhập đầu tiên hoặc làm mới gần đây nhất, bạn phải làm mới dữ liệu, thao tác này sẽ nhập lại toàn bộ dữ liệu.
  • DirectQuery: Không có dữ liệu nào được nhúng hoặc sao chép vào Power BI Desktop. Đối với các nguồn quan hệ, các bảng và cột được chọn sẽ xuất hiện trong danh sách Fields. Đối với các nguồn đa chiều như SAP Business Warehouse, các dimension và measure sẽ xuất hiện trong danh sách Fields. Khi bạn tạo hoặc tương tác với một trực quan, Power BI Desktop sẽ truy vấn nguồn dữ liệu cơ bản, vì thế, bạn luôn luôn xem dữ liệu của hiện tại.

Nhiều mô hình dữ liệu và biến đổi dữ liệu có sẵn khi sử dụng DirectQuery, mặc dù có một số hạn chế. Khi bạn tạo hoặc tương tác với một trực quan, bạn phải truy vấn dữ liệu cơ bản. Thời gian làm mới trực quan phụ thuộc vào hiệu suất của nguồn dữ liệu cơ bản. Khi dữ liệu cần để phục vụ yêu cầu đã được yêu cầu gần đây, Power BI sẽ dùng nó để giảm thời gian hiển thị. Nếu bạn chọn Refresh từ tab Home, tất cả trực quan sẽ được làm mới với dữ liệu hiện tại.

2. Lợi ích của việc sử dụng DirectQuery
  • Cho phép bạn xây dựng trực quan trên nhiều tập dữ liệu lớn mà bạn sẽ mất nhiều thời gian để nhúng.
  • Các thay đổi dữ liệu cơ bản có thể cần làm mới. Đối với một số báo cáo, nhu cầu hiển thị dữ liệu hiện tại có thể yêu cầu truyền dữ liệu lớn, khiến việc nhập lại không khả thi. Ngược lại, báo cáo DirectQuery luôn dùng dữ liệu hiện tại.
  • Giới hạn tập dữ liệu 1GB không áp dụng cho DirectQuery.
3. Hạn chế của DirectQuery
  • Nếu truy vấn Query Editor quá phức tạp, một lỗi sẽ xảy ra, để khắc phục, hãy xóa bước gây ra vấn đề trong Query Editor hoặc nhúng dữ liệu thay vì dùng DirectQuery. Đối với các nguồn đa chiều như SAP Business Warehouse, không có DirectQuery.
  • Calculated tables và calculated columns tham chiếu đến một bảng DirectQuery từ một nguồn dữ liệu với xác thực Single Sign-on (SSO) không được hỗ trợ trong Power BI Service.
  • Auto date/time không được hỗ trợ trong DirectQuery.
  • Có giới hạn 1 triệu dòng với các nguồn đám mây (cloud), các nguồn tại chỗ giới hạn ở 4 MB mỗi hàng hoặc kích thước dữ liệu 16MB cho toàn bộ hình ảnh. Giới hạn không ảnh hưởng đến tổng hợp hoặc tính toán được dùng để tạo tập dữ liệu được trả về bằng DirectQuery.
4. Những điều cần cân nhắc khi dùng DirectQuery
  • Hiệu suất và tải: Tất cả truy vấn DirectQuery được gửi đến cơ sở dữ liệu nguồn, vì thế, thời gian làm mới trực quan phụ thuộc vào tốc độ phản hồi của nguồn back-end với kết quả từ truy vấn.
  • Bảo mật: Mặc định, tất cả người dùng sử dụng báo cáo đã xuất bản kết nối với nguồn dữ liệu back-end bằng thông tin đăng nhập được nhập sau khi xuất bản với Power BI service. Quá trình này giống với dữ liệu được nhập: tất cả người dùng đều nhìn thấy cùng một dữ liệu, bất kể bất kỳ quy tắc bảo mật nào được xác định trong nguồn back-end.

Những khách hàng muốn triển khai bảo mật cho mỗi người dùng với các nguồn DirectQuery nên dùng RLSS hoặc định cấu hình xác thực bị ràng buộc bởi Kerberos.

  • Tính năng hỗ trợ: Một số tính năng trong Power BI Desktop không được hỗ trợ hoặc bị hạn chế trong chế độ DirectQuery, tương tự với Power BI service.

Lưu ý: Khi dùng DirectQuery với một Azure SQL Database và một địa chỉ private IP, cần cài đặt một cổng tại chỗ.

5. Xuất bản lên Power BI service           

Các báo cáo được tạo bằng DirectQuery có thể xuất bản lên Power BI service.

Nếu nguồn dữ liệu được dùng không cần On-premises data gateway (Azure SQL Database, Azure Synapse Analytics (formerly SQL Data Warehouse), or Redshift), bạn phải cung cấp thông tin đăng nhập trước khi Power BI service hiển thị báo cáo đã xuất bản.

  • Bước 1: Đăng nhập vào Power BI.
  • Bước 2: Trong Power BI service, chọn biểu tượng bánh răng và chọn Settings.

  • Bước 3: Trong trang Settings, chọn tab Datasets, chọn tập dữ liệu sử dụng DirectQuery và chọn Edit credentials.
  • Bước 4: Thêm thông tin đăng nhập, nếu không sẽ có lỗi khi bạn mở báo cáo đã xuất bản hoặc khám phá tập dữ liệu được tạo bằng kết nối DirectQuery.

Như vậy là bạn đã có thể kết nối đến các nguồn dữ liệu bằng DirectQuery trong Power BI Desktop, tạo báo cáo và xuất bản chúng lên Power BI service. Các nội dung mới nhất sẽ được cập nhật thường xuyên tại website bacs.vn, đừng quên đón đọc.

Nguồn tham khảo:

https://docs.microsoft.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

 

 
Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU - Giải pháp BUSINESS INTELLIGENCE (BI) - click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU - click vào đây
  • Tính năng mới trên tableau - verion 2019.1 - click vào đây

BAC - Biên soạn và tổng hợp nội dung