Tạo các trực quan Power BI bằng cách sử dụng Python

Với Power BI Desktop, bạn có thể sử dụng Python để trực quan dữ liệu của mình.

1. Điều kiện tiên quyết

Làm việc thông qua hướng dẫn cách chạy các tập lệnh Python trong Power BI Desktop bằng cách sử dụng tập lệnh Python:

import pandas as pd 
df = pd.DataFrame({ 
    ‘Fname’:[ ‘Harry’,’Sally’,’Paul’,’Abe’,’June’,’Mike’,’Tom’],
    “Age’:[21,34,42,18,24,80,22], 
    ‘Weight’: [180, 130, 200, 140, 176, 142, 210], 
    ‘Gender’:[‘M’,‘F’,‘M’,‘M’,‘F’,‘M’,‘M’], 
    ‘State’:[‘Washington’,‘Oregon’,‘California’,‘Washington’,‘Nevada’,‘Texas’,‘Nevada’],
    ‘Children’:[4,1,2,3,0,2,0],
    ‘Pets’:[3,2,2,5,0,1,5] 
}) 
print (df) 
 

Bài viết dưới đây sẽ hướng dẫn bạn cách cài đặt Python trên máy cục bộ (local machine) và kích hoạt nó để tạo tập lệnh trong Power BI Desktop. Hướng dẫn này sử dụng dữ liệu từ tập lệnh trên để minh họa việc tạo các trực quan Python.

Tham khảo: Cách chạy các tập lệnh Python trong Power BI Desktop

2. Tạo trực quan Python trong Power BI Desktop
  • Bước 1: Chọn biểu tượng trực quan Python trong khung Visualizations.

  • Bước 2: Trong hộp thoại Enable script visuals xuất hiện, bạn chọn Enable. Khi bạn thêm một trực quan Python vào một báo cáo, Power BI Desktop sẽ thực hiện các việc sau:

    • Một hình ảnh trực quan Python xuất hiện trong cửa sổ làm việc.
    • Python script editor sẽ xuất hiện bên dưới.
  • Bước 3: Kéo các trường Age, Children, Fname, Gender, Pets, State và Weight vào phần Values tại dòng Add data fields here như ảnh dưới:

Tập lệnh Python của bạn chỉ có thể sử dụng các trường được thêm vào phần Values. Bạn cũng có thể thêm hoặc xóa các trường trong khi làm việc với tập lệnh Python của mình. Power BI Desktop sẽ tự động phát hiện các thay đổi trường.

Lưu ý: Loại tổng hợp mặc định cho các trực quan Python là do not summarize

  • Bước 4: Bây giờ, bạn có thể sử dụng dữ liệu bạn đã chọn để tạo một plot.

Khi bạn chọn hoặc xóa các trường, mã hỗ trợ trong trình chỉnh sửa tập lệnh Python được tạo hoặc xóa tự động.

Dựa trên sự lựa chọn của bạn, trình soạn thảo tập lệnh Python tạo mã liên kết sau.

  • Trình chỉnh sửa đã tạo khung dữ liệu tập dữ liệu, với các trường bạn đã thêm.
  • Tổng hợp mặc định là: do not summarize.
  • Tương tự như các trực quan bảng, các trường được nhóm lại và các hàng trùng lặp chỉ xuất hiện một lần.

Lưu ý: Trong một số trường hợp, bạn có thể không muốn nhóm tự động mà muốn xuất hiện tất cả các dòng, bao gồm cả các dòng trùng lặp. Nếu vậy, bạn có thể thêm trường chỉ mục vào tập dữ liệu của mình để làm tất cả các dòng được xem là duy nhất và ngăn việc nhóm lại.

Bạn có thể truy cập các cột trong tập dữ liệu bằng các tên tương ứng của chúng. Ví dụ, bạn có thể mã hóa tập dữ liệu  [“Age”]  trong tập lệnh Python của mình để truy cập trường tuổi.

  • Bước 5: Với khung dữ liệu được tạo tự động bởi các trường bạn đã chọn, bạn đã có thể viết một tập lệnh Python dẫn đến thiết bị Python tự động. Khi tập lệnh hoàn tất, hãy chọn Run từ thanh tiêu đề của Python script editor.

Power BI Desktop vẽ lại hình ảnh nếu có bất kỳ sự kiện nào sau đây xảy ra:

  • Khi bạn chọn Run từ thanh tiêu đề Python script editor
  • Bất cứ khi nào có một sự thay đổi dữ liệu, do làm mới, lọc hoặc đánh dấu dữ liệu.

Khi bạn chạy một tập lệnh Python dẫn đến lỗi, trực quan Python không được vẽ và thông báo sẽ xuất hiện. Để biết chi tiết lỗi, hãy chọn See details từ thông báo.

Để có cái nhìn lớn hơn về các trực quan, bạn có thể thu nhỏ Python script editor.

3. Tạo một scatter plot
  • Bước 1: Bên dưới Paste or type your script code here, nhập mã này:

import matplotlib.pyplot as plt

dataset.plot(kind=’Scatter‘, x=’Age‘, y=’Weight‘, color=’Red‘)

plt.show()

 

Trình chỉnh sửa tập lệnh sẽ trong như ảnh dưới đây:

Thư viện matplotlib được nhúng vào để vẽ và tạo các trực quan.

  • Bước 2: Khi bạn chọn nút Run, scatter plot sẽ tạo trong trực quan Python.

4. Tạo một biểu đồ đường có nhiều cột

Hãy tạo một biểu đồ đường cho mỗi người để hiển thị số lượng trẻ em và vật nuôi của họ. Xóa hoặc nhận xét mã bên dưới Paste or type your script code here và nhập mã Python này:

import matplotlib.pyplot as plt

ax = plt.gca()

dataset.plot(kind=’line‘,x=’Fname‘,y=’Children‘,ax=ax)

dataset.plot(kind=’line‘,x=’Fname‘,y=’Pets‘, color=’red‘, ax=ax)

plt.show()

 

Khi bạn chọn Run, biểu đồ được với nhiều cột được tạo.

5. Tạo một biểu đồ thanh

Chúng ta sẽ tạo một biểu đồ thanh cho độ tuổi của mỗi người. Xóa hoặc nhận xét mã bên dưới Paste or type your script code here và nhập vào mã Python này:

import matplotlib.pyplot as plt

dataset.plot(kind=’bar‘,x=’Fname‘,y=’Age‘)

plt.show()

 

Khi bạn chọn nút Run, biểu đồ thanh sẽ được tạo.

Lưu ý: An toàn tập lệnh Python: Các trực quan Python được tạo từ tập lệnh Python có thể chứa mã với rủi ro về quyền riêng tư hoặc bảo mật. Khi bạn cố gắng xem hoặc tương tác với một trực quan Python lần đầu, người dùng sẽ nhận được thông báo bảo mật. Chỉ khởi động trực quan Python nếu bạn tin tưởng tác giả và nguồn hoặc sau khi bạn xem xét và hiểu tập lệnh Python.

6. Giới hạn

Một số giới hạn của trực quan Python trong Power BI Desktop:

  • Kích thước dữ liệu: Dữ liệu được dùng bởi trực quan Python để vẽ giới hạn ở 150.000 dòng. Nếu chọn nhiều hơn, chỉ có 150.000 dòng được dùng và có một thông báo trên hình ảnh. Dữ liệu đầu vào tối đa 250MB.
  • Độ phân giải: Tất cả trực quan Python hiển thị ở 72 DPI.
  • Thời gian thực hiện phép tính: Tối đa 5 phút, nếu một phép tính trực quan Python chưa hoàn tất sẽ dẫn đến lỗi.
  • Mối quan hệ: Cần có mỗi quan hệ xác định giữa các trường dữ liệu từ các bảng khác nhau tương tự các trực quan Power BI Desktop khác.
  • Trực quan Python được làm mới khi cập nhật, lọc và đánh dấu dữ liệu. Tuy nhiên, bản thân trực quan không có tính tương tác và không thể là nguồn lọc chéo.
  • Các trực quan Python phản hồi để làm nổi bật các trực quan khác nhưng bạn không thể nhấp vào các phần tử trong trực quan Python để lọc chéo các phần tử.
  • Chỉ các ô được vẽ cho thiết bị hiển thị mặc định Python mới được hiển thị chính xác. Tránh sử dụng một thiết bị hiển thị Python khác.
  • Các trực quan Python không hỗ trợ đổi tên các cột đầu vào. Các cột sẽ được gọi bằng tên ban đầu của chúng trong quá trình thực thi tập lệnh.

Trên đây là hướng dẫn tạo các trực quan Power BI bằng cách sử dụng Python trong Power BI Desktop. Mong rằng những thông tin được chia sẻ trên đây sẽ hữu ích với bạn đọc. Đừng quên đón xem các bài viết mới nhất sẽ được cập nhật thường xuyên tại website bacs.vn.

Nguồn tham khảo:

https://docs.microsoft.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

 

Previous Post
Next Post