Bạn có thể chạy các tập lệnh Python trực tiếp trong Power BI Desktop và nhúng các tập dữ liệu kết quả vào mô hình dữ liệu Power BI Desktop.
1. Cài đặt Python
Để chạy các tập lệnh Python trong Power BI Desktop, bạn cần cài đặt Python trên máy cục bộ (local) của mình. Bạn có thể tải Python từ website python.org. Bản phát hành tập lệnh Python hiện hỗ trợ các ký tự Unicode và dấu cách trong đường dẫn cài đặt.
Tích hợp Power BI Python yêu cầu cài đặt hai gói Python:
- Pandas: Một thư viện phần mềm để thao tác và phân tích dữ liệu. Nó cung cấp các cấu trúc dữ liệu và phép toán để thao tác với các bảng số và chuỗi thời gian. Dữ liệu đã nhập của bạn phải nằm trong một pandas data frame. Một data frame là một cấu trúc dữ liệu hai chiều. Ví dụ: dữ liệu được căn chỉnh theo kiểu bảng trong các hàng và cột.
- Matplotlib. Một thư viện vẽ đồ thị cho Python và phần mở rộng toán học số NumPy của nó. Nó cung cấp một API hướng đối tượng để nhúng các plots vào các ứng dụng bằng cách dùng các bộ công cụ GUI chung mục đích, như Tkinter, wxPython, Qt hoặc GTK +.
Trong một console hoặc shell, sử dụng công cụ dòng lệnh pip để cài đặt hai gói. Công cụ pip được đóng gói với các phiên bản Python mới hơn.
CMD:
pip install pandas
pip install matplotlib
2. Khởi động tập lệnh Python
- Bước 1: Trong Power BI Desktop, chọn File > Options and Settings > Options > Python scripting, trang Python script options sẽ xuất hiện.
- Bước 2: Nếu cần thiết, hãy chỉ định đường dẫn cài đặt Python cục bộ của bạn trong Detected Python home directories.
Trong ảnh trên, đường dẫn cục bộ cài đặt Python là C:\Python. Hãy đảm bảo đường dẫn dành cho cài đặt Python cục bộ mà bạn muốn Power BI Desktop sử dụng.
- Bước 3: Nhấn OK.
Khi bạn chỉ định cài đặt Python của mình, bạn đã sẵn sàng để bắt đầu chạy các tập lệnh Python trong Power BI Desktop.
3. Chạy các tập lệnh Python
Chỉ trong vài bước, bạn có thể chạy các tập lệnh Python và tạo một mô hình dữ liệu. Từ mô hình này, bạn có thể tạo các báo cáo (report) và chia sẻ chúng trên Power BI service.
Đầu tiên, bạn cần tạo một tập lệnh trong môi trường phát triển Python cục bộ của mình và chắc chắn nó chạy thành công. Ví dụ, dưới đây là một tập lệnh Python đơn giản nhúng pandas và sử dụng một data frame.
Python:
import pandas as pd
data = [[‘Alex’,10],[‘Bob’,12],[‘Clarke’,13]]
df = pd.DataFrame(data,columns=[‘Name’,’Age’],dtype=float)
print (df)
Khi chạy, tập lệnh sẽ trả về:
Name Age
0 Alex 10.0
1 Bob 12.0
2 Clarke 13.0
Khi chuẩn bị và chạy một tập lệnh Python trong Power BI Desktop, sẽ có một số giới hạn:
- Chỉ có pandas data frame được nhúng, vì thế, hãy chắc chắn dữ liệu mà bạn muốn nhúng vào Power BI được thể hiện trong một data frame.
- Bất kỳ tập lệnh Python nào chạy lâu hơn 30 phút sẽ hết thời gian (time out).
- Các lệnh gọi tương tác trong tập lệnh Python như là chờ người dùng nhập, sẽ tạm dừng quá trình thực thi của tập lệnh.
- Khi đặt thư mục làm việc trong tập lệnh Python, bạn phải xác định một đường dẫn đầy đủ đến thư mục làm việc, thay vì đường dẫn tương đối.
- Các bảng lồng nhau hiện không được hỗ trợ.
Tiếp theo, để chạy tập lệnh Python trong Power BI Desktop, thực hiện các bước sau:
- Bước 1: Chọn tab Home trong cửa sổ làm việc của Power BI Desktop, chọn Get Data > Other.
- Bước 2: Chọn Other > Python script như ảnh dưới đây:
- Bước 3: Chọn Connect. Phiên bản Python mới nhất được cài đặt cục bộ của bạn được chọn làm công cụ Python của bạn.
Sao chép tập lệnh của bạn vào hộp thoại Python script, bạn có thể sử dụng một tập lệnh Python đơn giản như dưới đây.
- Bước 4: Chọn OK. Nếu tập lệnh chạy thành công, Navigator như hình dưới sẽ xuất hiện và bạn có thể tải dữ liệu và dùng nó. Ví dụ, chạy df, như trong ảnh, sau đó chọn Load.
5. Xử lý sự cố
Trong trường hợp, chưa cài đặt hoặc không xác định được Python, một cảnh báo sẽ hiển thị. Bạn cũng có thể gặp cảnh báo nếu bạn có nhiều cài đặt máy cục bộ, truy cập và xem lại các cài đặt Python trước và khởi động các phần tập lệnh Python.
5.1. Sử dụng các bản phân phối Power BI tùy chỉnh
Power BI thực thi các tập lệnh trực tiếp bằng cách dùng tệp thực thi python.exe từ thư mục do người dùng cung cấp (thông qua trang cài đặt). Các bản phân phối yêu cầu thêm một bước để chuẩn bị môi trường (ví dụ: Conda) có thể gặp sự cố trong đó việc thực thi của chúng không thành công.
Bạn nên dùng các bản phân phối Python chính thức từ trang chủ ở trên để tránh các vấn đề liên quan. Một giải pháp khả thi đó là khởi động Power BI Desktop từ lời nhắc môi trường Power BI tùy chỉnh của mình.
5.2. Refresh
Bạn có thể làm mới (refresh) tập lệnh Python trong Power BI Desktop. Để làm mới, hãy chuyển đến tab Home và chọn Refresh. Khi bạn làm mới một tập lệnh Python, Power BI Desktop sẽ chạy tập lệnh một lần nữa.
Như vậy là BAC đã hướng dẫn cho bạn cách chạy tập lệnh Python trong Power BI Desktop. Mong rằng những thông tin trên sẽ hữu ích với bạn đọc quan tâm chủ đề phân tích dữ liệu nói chung và Power BI nói riêng. Để không bỏ lỡ những kiến thức hữu ích về phân tích và trực quan dữ liệu, hãy đón xem các bài viết mới nhất tại website bacs.vn.
Nguồn tham khảo:
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – version 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung