Scatter charts, bubble charts và Dot Plot là những biểu đồ khá phổ biến trong phân tích dữ liệu. Các biểu đồ này được Power BI cung cấp sẵn và có thể tùy biến dễ dàng cho nhiều mục đích. Bài viết này, BAC sẽ giúp bạn khám phá thông qua các ứng dụng thực tế.
Bài viết bao gồm các nội dung:
1. Khi nào nên sử dụng một Scatter chart, bubble chart hoặc một dot plot chart
Scatter chart luôn luôn có hai trục giá trị để hiển thị: một bộ dữ liệu số dọc theo trục ngang và một bộ giá trị số khác dọc theo trục dọc. Biểu đồ hiển thị các điểm tại giao điểm của giá trị số x và y, kết hợp các giá trị này thành các điểm dữ liệu liệu duy nhất. Power BI có thể phân phối các điểm dữ liệu này đồng đều hoặc không đồng đều trên trục hoành. Điều đó sẽ phụ thuộc vào dữ liệu mà biểu đồ đại diện. Bạn có thể đặt tối đa 10,000 điểm dữ liệu.
1.1. Scatter chart và bubble chart
Kích thước bong bóng sẽ đại diện cho kích thước dữ liệu
Scatter chart biểu thị mối quan hệ giữa 2 giá trị số. Bubble chart thay thế các điểm dữ liệu bằng các bong bóng, với kích thước bong bóng đại diện cho kích thước dữ liệu. Scatter chart thường được dùng trong các trường hợp:
- Biểu diễn mối quan hệ giữa 2 giá trị số.
- Vẽ hai nhóm số dưới dạng một chuỗi tọa độ x và y.
- Sử dụng thay biểu đồ đường khi bạn muốn thay đổi tỷ lệ của trục ngang.
- Cần chuyển trục ngang thành thang đo logarit.
- Hiển thị dữ liệu bảng tính bao gồm các cặp hoặc nhóm giá trị được nhóm.
Lưu ý: Trong Scatter chart, bạn có thể điều chỉnh tỷ lệ độc lập của các trục để tiết lộ thêm thông tin về các giá trị được nhóm.
- Hiển thị các mẫu trong các bộ dữ liệu lớn, ví dụ hiển thị các xu hướng tuyến tính hoặc phi tuyến tính, cụm và ngoại lệ.
- So sánh số lượng lớn các điểm dữ liệu mà không cần quan tâm đến thời gian. Càng nhiều dữ liệu mà bạn đưa vào Scatter chart, thì sự so sánh mà bạn có thể thực hiện càng tốt.
Ngoài những gì mà Scatter chart có thể làm, bubble chart còn mang đến một số ứng dụng khác:
- Khi dữ liệu của bạn có ba chuỗi dữ liệu, mỗi chuỗi chứa một tập hợp các giá trị.
- Trình bày dữ liệu thuộc lĩnh vực tài chính. Kích thước bong bóng khác nhau rất hữu ích để nhấn mạnh trực quan các giá trị cụ thể.
- Sử dụng với góc phần tư.
1.2. Dot plot charts
Dot plot chart thì tương tự như bubble chart và scatter chart nhưng thay vào đó được dùng để vẽ phân loại dữ liệu dọc theo trục X.
Các loại biểu đồ trên là lựa chọn tuyệt vời nếu bạn muốn bao gồm dữ liệu phân loại dọc theo trục X.
1.3. Các bước chuẩn bị:
Hướng dẫn dưới đây sử dụng tệp Retail Analysis sample PBIX. Bạn có thể tải tệp về máy tính tại đây.
- Bước 1: Từ góc trên bên trái chọn menu File > Open.
- Bước 2: Tìm đến tệp mà bạn đã tải về ở trên.
- Bước 3: Mở tệp lên và chọn chế độ xem báo cáo.
- Bước 4: Nhấp vào dấu cộng bên dưới để tạo một trang mới.
2. Cách tạo một Scatter chart
- Bước 1: Bắt đầu từ một trang báo cáo trống, từ thanh Fields chọn các fields sau:
- Sales > Sales Per Sq Ft
- Sales > Total Sales Variance %
- District > District
- Bước 2: Trong thanh Visualization, chọn biểu tượng của Scatter chart đã được đánh dấu trong hình minh họa dưới đây.
- Bước 3: Kéo District từ Details vào dòng Legend.
Power BI hiển thị một scatter chart mà giá trị Total Sales Variance % dọc theo trục Y và Sales Per Square Feet dọc theo trục X. Màu sắc điểm dữ liệu sẽ đại diện cho các quận.
Bây giờ, chúng ta sẽ thêm vào một dimension thứ ba.
3. Cách tạo một bubble chart
- Bước 1: Từ thanh Fields, kéo Sales > This Year Sales > Value vào ô Size. Các điểm dữ liệu sẽ mở rộng để tương ứng với giá trị sales. Xem ảnh minh họa bên dưới để biết thứ tự các bước thực hiện.
- Bước 2: Rê chuột của bạn qua một bong bóng bất kì. Kích thước của bong bóng sẽ phản chiếu giá trị của This Year Sales.
- Bước 3: Để đặt số lượng của điểm dữ liệu hiển thị trong bubble chart, trong phần Format của khung Visualization, mở rộng phần General và điều chỉnh giá trị Data Volume, xem ảnh minh họa.
Bạn có thể đặt khối lượng dữ liệu tối đa là 10,000, khi bạn đặt giá trị cao hơn, hãy thử nghiệm trước để đảm bảo hiệu suất.
Lưu ý: Càng nhiều điểm dữ liệu càng mất nhiều thời gian tải. Nếu bạn chọn publish các reports với giới hạn cao hơn, hãy chắc chắn kiểm tra các reports của bạn trên web và mobile.
- Bước 4: Tiếp tục định dạng màu sắc của trực quan, nhãn (labels), tiêu đề (titles), background (nền)…. Để cải thiện khả năng tiếp cận của biểu đồ, Power BI còn cung cấp tính năng thêm các hình dạng đánh dấu vào mỗi dòng. Để chọn hình, bạn mở rộng dòng Shape, chọn Marker shape và chọn một hình bất kì.
Thay đổi hình dạng đánh dấu thành một hình kim cương (diamond), tam giác (triangle) hoặc hình vuông (square). Việc sử dụng các hình dạng đánh dấu khác nhau cho mỗi dòng giúp báo cáo rõ ràng hơn cho người xem.
- Bước 5: Chọn tab Analytic biểu tượng kính lúp trong khung Visualization và thêm thông tin bổ sung vào trực quan của bạn.
Thêm một đường trung bình bằng cách chọn Median line > Add. Mặc định, Power BI sẽ thêm một đường trung bình cho Sales per sq ft. Điều này không thực sự hữu ích khi chúng ta có thể thấy rằng có đến 10 điểm dữ liệu và biết đường trung bình sẽ được tạo với 5 điểm ở mỗi bên. Thay vào đó, chuyển Measure thành Total sales variance % và kết quả thu được như ảnh.
Tiếp theo, chúng ta sẽ thêm biểu tượng đối xứng để chỉ ra điểm nào có giá trị cao hơn của measure trục x so với measure trục y và ngược lại. Khi bạn thay đổi biểu tượng đối xứng trên tab Analytic, Power BI hiển thị cho bạn nền của scatter chart dựa trên các ranh giới trên và dưới của trục hiện tại của bạn. Đây là một cách rất nhanh để xác định measure trục nào ưu tiên điểm dữ liệu, đặc biệt là khi bạn có phạm vi trục khác nhau cho hai trục x và y.
- Thay đổi trường Total sales variance % thành Gross margin last year %
- Từ tab Analytic, thêm Symmetry shading, chúng ta có thể thấy từ biểu đồ rằng Hosiery (bong bóng màu xanh lá cây trên nền hồng) là danh mục duy nhất ưu tiên gross margin thay vì doanh thu trên mỗi ô của cửa hàng.
Tiếp tục khám phá tab Analytic để tìm ra những điểm thú vị bên trong dữ liệu của bạn.
4. Cách tạo một dot plot chart
Bây giờ, để tạo một dot plot chart, bạn cần thay thế trường trục X bằng số bằng một trường phân loại. Từ khung X-Axis, bạn xóa Sales per sq ft và thay thế nó với District > District Manager, xem ảnh minh họa.
5. Xem xét và xử lý sự cố
Chỉ xuất hiện một điểm dữ liệu bên trong scatter chart
Trường hợp bạn tạo một Scatter chart và chỉ xuất hiện một điểm duy nhất trên biểu đồ, có thể đó là giá trị tổng hợp của tất cả giá trị trên trục X và Y. Một trường hợp khác đó là tổng của tất cả giá trị trên một đường hoặc trục.
Thêm một trường vào ô Details để báo với Power BI cách nhóm các giá trị. Trường phải là duy nhất cho mỗi điểm mà bạn muốn vẽ. Đó có thể là một số hàng hoặc ID của trường.
Nếu không có trường như trên trong dữ liệu của bạn, hãy tạo ra một trường nối các giá trị trên trục X và Y lại với nhau thành một điểm duy nhất cho mỗi điểm.
Để tạo một trường mới trong Power BI, bạn có thể sử dụng Power BI Desktop Query Editor để thêm một Index Column và dataset của bạn. Sau đó, bạn chỉ cần thêm cột này vào ô Detail trong trực quan của mình.
Tham khảo: Thêm một cột tùy chỉnh trong Power BI Desktop
Bài viết hướng dẫn chứa nhiều bước mà bạn đọc cần thực hiện đúng theo thứ tự. Hy vọng rằng những thông tin được BAC tổng hợp trên đây sẽ hữu ích với bạn đọc quan tâm lĩnh vực phân tích dữ liệu. Đừng quên đón đọc các bài viết mới nhất của BAC tại website bacs.vn.
Nguồn tham khảo: docs.microsoft.com
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung