Qua các bài viết trước chúng ta đã biết cách kết nối và chỉnh sửa dữ liệu trên Power BI Desktop. Trong thực tế, việc sử dụng nhiều dữ liệu từ các nguồn khác nhau để bổ sung thông tin ngày một phổ biến. Tuy nhiên, khó khăn lớn nhất là việc kết hợp dữ liệu từ các bảng khác nhau.
1. Kết nối dữ liệu
Vì chúng ta sẽ sử dụng bảng mới để kết nối với bảng trong bài trước. Nên bạn cần mở lại Query đã làm, nếu chưa có hãy xem và làm lại để ôn lại bài nhé.
Xem lại: Hướng dẫn chỉnh sửa dữ liệu trong Power BI Desktop
Để mở một file Power BI đã lưu, mở phần mềm chọn biểu tượng ở góc trái, chọn Open và tìm đến file. Tiếp tục, tại menu Home chọn Edit Queries để mở bảng dữ liệu đã lưu trước đó.
Sau khi bảng cũ đã được tải lên chọn New Source => Other => Web. Hoặc bạn có thể chọn tại dấu mũi tên bên dưới nút New Source. Copy địa chỉ sau vào http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations
2. Chỉnh sửa dữ liệu
Sau khi import dữ liệu vào Power BI Desktop, chú ý 3 dòng đầu tiên của bảng. Đây là dòng được tạo ra khi tạo bảng trên trang web và nó không có ý nghĩa, vì vậy ta sẽ xóa nó đi.
Tại menu Home chọn Remove Rows tiếp tục chọn Remove Top Rows và nhập số dòng muốn xóa từ trên xuống là 3.
Lưu ý: Dữ liệu trong bảng này có thể thay đổi theo thời gian, vì thế khi làm theo mẫu bạn chọn xóa những dòng không liên quan. Trong ví dụ trên của chúng ta là 3 dòng đầu, từ dòng thứ 4 là thông tin mà chúng ta sử dụng nên không xóa.
Tiếp tục xóa 26 dòng dưới cùng của bảng bằng chọn menu Home => Remove Rows => Remove Bottom Rows và nhập số dòng muốn xóa từ dưới lên là 26. Đây là các vùng lãnh thổ mà chúng ta không cần đến, ta chỉ dùng các tiểu bang.
Tại mục đánh dấu Name and status region2 (nơi ghi chú State cho tiểu bang và District cho quận), ta sẽ lọc ra các tiểu bang như đã nói. Chọn dấu mũi tên bên cạnh tên cột và bỏ chọn mục Federal district để lọc các Quận ra.
Bây giờ chúng ta sẽ tách 2 cột tên vùng và tên viết tắt 2 chữ để bổ sung cho bảng trong bài trước. Vì thế, ta cần xóa bỏ các cột còn lại, thao tác xóa cột tương tự như bài học trước, bạn giữ phím “Ctrl” để chọn các cột cần xóa. Sau đó, chọn menu Home => Remove Column để xóa các cột đã chọn.
Lưu ý: dữ liệu sử dụng trong bài có thể thay đổi theo thời gian, trong ví dụ trên ta sẽ xóa cột 1,3,4 và từ cột 6 đến hết. Chỉ giữ lại 2 cột 2 và 5 là cột tên vùng và mã vùng viết tắt bằng 2 ký tự.
Để dễ phân biệt 2 cột hãy đổi tên 2 cột lần lượt là “State Name” và “State Code”. Tại bảng này tôi cũng đổi tên là State Code, bảng cũ đổi tên RetirementStats, cách đổi tên đã nói trong bài trước.
3. Kết hợp 2 bảng dữ liệu
Bây giờ, chúng ta đã có 2 bảng với các thông tin cần thiết, yêu cầu kết nối 2 bảng để hiển thị mã viết tắt của các vùng trong bảng cũ (RetirementStats) dựa trên dữ liệu từ bảng mới (State Code).
Có 2 cách chính để kết hợp 2 bảng đó là: Merge và Append
- Merge: khi bạn muốn thêm một hoặc nhiều cột vào một bảng khác.
- Append: khi bạn muốn thêm các hàng dữ liệu vào một bảng đã có.
Trong trường hợp này chúng ta cần thêm cột mã vùng nên sẽ chọn kiểu kết hợp là Merge. Tại cột Queries, chọn bảng RetirementStats, chọn menu Home =>Merge Queries.
Tại cửa sổ bật ra, chọn bảng State Code, tiếp tục chọn cột liên kết giữa 2 bảng. Ở đây chúng ta sẽ chọn cột State ở bảng RetirementStats và State Name ở bảng State Code là 2 cột dùng để tạo kết nối.
Một thông báo sẽ cho biết tình trạng kết nối giữa 2 bảng, trong ví dụ này chúng ta có 50 dòng phù hợp. Bạn có thể hiểu với 50 tên tiểu bang ở bảng RetirementStats, khi kết nối sẽ nhận được đúng 50 ký hiệu viết tắt từ bảng State Code.
Kết quả bạn sẽ nhận được là một cột mới ở bảng RetirementStats có tên State Code. Tuy nhiên, do cột mới này sẽ nhận giá trị của tất cả các cột được kết hợp nên dữ liệu sẽ chỉ hiển thị là Table.
Bạn có thể chọn lại cột muốn hiển thị ở đây bằng cách chọn ký hiệu “Expand” bên cạnh tên cột. Sau đó bỏ chọn những cột không muốn hiển thị, ngoài ra, tên cột cũ sẽ được đính kèm khi bạn chọn vào ô “Use original column name as prefix”.
Kết quả, sau khi bỏ chọn cột State Name và ô “Use original column name as prefix” ta thu được cột State Code với mã vùng tương ứng theo tên tiểu bang. Như vậy, chúng ta vừa hoàn thành việc kết hợp thành công 2 bảng ở 2 nguồn dữ liệu để tạo ra 1 bảng đầy đủ.
Trong quá trình thực hiện lưu ý rằng các dữ liệu trên có thể thay đổi theo thời gian. Vì vậy, bạn cần chú ý tên bảng và các dòng dữ liệu, nếu gặp khó khăn trong quá trình thực hiện hãy để lại comment bên dưới để được BAC hỗ trợ nhé.
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Tham khảo chương trình đào tạo:
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì ?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
Biên soạn và tổng hợp nội dung