Cách tạo biểu thức Level of Detail (LOD) trong Tableau

Level of Detail expressions ( hay biểu thức LOD) cho phép bạn tính toán các giá trị ở cấp độ nguồn dữ liệu và cấp độ trực quan hóa. Tuy nhiên, biểu thức LOD thậm chí cho bạn nhiều kiểm soát hơn về mức độ chi tiết mà bạn muốn tính toán. Chúng có thể được thực hiện ở cấp độ chi tiết hơn (INCLUDE) hoặc ít chi tiết hơn (EXCLUDE) hoặc hoàn toàn độc lập (FIXED).

Bài viết này giải thích các loại biểu thức LOD bạn có thể dùng trong Tableau, khi nào cần sử dụng, cách định dạng…. Chúng ta sẽ cùng đi qua một ví dụ để hiểu cách tạo một biểu thức LOD đơn giản.

1. Cách tạo biểu thức LOD

Các bước dưới đây sẽ giúp bạn học được cách tạo và sử dụng một biểu thức LOD trong Tableau.

1.1. Cài đặt trực quan
  • Bước 1: Mở Tableau Desktop và kết nối đến dữ liệu mẫu Sample-Superstore đã được tích hợp sẵn.

  • Bước 2: Mở một worksheet mới.
  • Bước 3: Từ thanh Data, bên dưới Dimension, kéo Region vào ngăn Columns.
  • Bước 4: Từ thanh Data, bên dưới Measures, kéo Sales vào ngăn Rows.

Một biểu đồ cột biểu diễn tổng doanh số của mỗi vùng (region) xuất hiện như ảnh dưới.

1.2. Tạo biểu thức LOD

Thay vì lấy ra tổng doanh số bán hàng cho mỗi vùng, có lẽ bạn muốn xem doanh số bán hàng trung bình trên mỗi khách hàng cho mỗi vùng. Đây là lúc bạn cần tạo một biểu thức LOD để thực hiện điều này.

  • Bước 1: Chọn Analysis > Create Calculated Field.
  • Bước 2: Trong trình chỉnh sửa Calculation, thực hiện những thay đổi sau:

    • Đặt tên phép tính, Sales Per Customer.
    • Nhập vào công thức sau:

{ INCLUDE [Customer Name] : SUM([Sales]) }

  • Bước 3: Khi đã hoàn tất, nhấn OK. Lúc này, biểu thức LOD mới được thêm vào thanh Data, bên dưới ngăn Measures.
1.3. Sử dụng biểu thức LOD trong trực quan
  • Bước 1: Từ thanh Data, bên dưới Measures, kéo Sales Per Customer vào ngăn Rows và thay thế nó vào bên trái của thẻ SUM(Sales).
  • Bước 2: Trên ngăn Rows, nhấp chuột phải vào Sales Per Customer và chọn Measure (Sum) > Average.

Bây giờ, bạn có thể xem cùng lúc hai giá trị là tổng doanh số bán hàng cho mỗi vùng và doanh số bán hàng trung bình trên mỗi khách hàng cho từng vùng. Ví dụ, bạn có thể thấy khu vực trung tâm (Central) tổng doanh số là 500.000USD và doanh số trung bình mỗi khách hàng xấp xỉ 800.000USD.

2. Các loại biểu thức LOD

Hiện nay, có 3 loại biểu thức LOD mà bạn có thể tạo trong Tableau:

Bạn cũng có thể phân bổ một biểu thức vào bảng, đây được gọi là một Table-Scoped LOD expression (biểu thức LOD trong phạm vi bảng).

2.1 FIXED

Biểu thức FIXED tính toán một giá trị sử dụng các dimensions được chỉ định mà không cần tham chiếu đến các dimensions trong view.

Ví dụ:

Biểu thức FIXED tính tổng doanh số cho mỗi vùng:

{FIXED [Region] : SUM([Sales])}

Biểu thức này được đặt tên là [Sales by Region], được đặt trên ô Text để hiển thị tổng doanh số mỗi vùng.

Cấp độ chi tiết là [Region] cộng [State] nhưng vì biểu thức FIXED không xem xét cấm độ chi tiết view. Phép tính chỉ sử dụng dimension được tham chiếu trong phép tính, trong trường hợp này là Region. Vì thế, bạn có thể thấy các giá trị cho mỗi bang khác nhau là như nhau.

Nếu từ khóa INCLUDE được sử dụng trong biểu thức LOD thay vì FIXED, giá trị sẽ khác cho mỗi bang. Bởi vì, Tableau sẽ thêm dimension trong biểu thức ([Region]) với bất kỳ dimensions khác trong view ([State]), khi xác định các giá trị biểu thức. Kết quả thu được sẽ như sau:

2.2 INCLUDE

Biểu thức INCLUDE tính toán các giá trị sử dụng các dimensions được chỉ định và thêm bất kỳ dimensions nào có trong view.

Biểu thức INCLUDE khá hữu ích khi bạn muốn tính toán ở mức độ chi tiết nhỏ trong cơ sở dữ liệu và sau đó tổng hợp lại để hiển thị ở mức độ chi tiết thô hơn trong view. Các trường dựa trên biểu thức INCLUDE sẽ thay đổi khi bạn thêm hoặc xóa các dimensions khỏi view.

Ví dụ 1:

 Biểu thức INCLUDE dưới đây tính toán tổng doanh số trên mỗi khách hàng:

{ INCLUDE [Customer Name] : SUM([Sales]) }

Khi phép tính đó được đặt trên ngăn Rows, tổng hợp AVG (trung bình) và dimension [Region] được đặt trên ngăn Columns, view sẽ hiển thị doanh số bán hàng trung bình của khách hàng trên mỗi khu vực:

Nếu measures [Sales] sau đó được kéo vào ngăn Rows, kết quả minh họa sự khác nhau giữa tổng doanh số mỗi vùng và doanh số trung bình của khách hàng ở mỗi vùng:

Ví dụ 2:

Biểu thức INCLUDE dưới đây tính tổng doanh số bán hàng trên mỗi bang:

{ INCLUDE [State] : SUM(Sales)}

Phép tính được đặt trên ngăn Rows và lấy trung bình. Hình ảnh trực quan kết quả trung bình tổng doanh số bán hàng theo tiểu bang trên các danh mục.

Khi Segment được thêm vào ngăn Columns và phép toán được di chuyển đến ô Label, biểu thức LOD sẽ cập nhật lại kết quả. Giờ đây, bạn có thể thấy tổng doanh số trung bình trên mỗi tiểu bang khác nhau như thế nào giữa các danh mục và phân khúc.

2.3 EXCLUDE

Biểu thức EXCLUDE khai báo các dimensions để bỏ qua mức độ chi tiết của view. Biểu thức này khá tốt khi được sử dụng cho việc tìm “percent of total” (phần trăm tổng) hoặc “difference from overall average” (sự khác biệt so với mức trung bình chung).

Biểu thức EXCLUDE không thể sử dụng trong biểu thức cấp độ hàng (nơi không có dimensions nào để bỏ qua). Nhưng có thể được dùng để chỉnh sửa phép tính cấp view hoặc bất kỳ thứ gì ở giữa (nghĩa là bạn có thể dùng phép tính EXCLUDE để loại bỏ dimension khỏi một số biểu thức LOD khác).

Ví dụ 1:

Biểu thức EXCLUDE dưới đây tính tổng doanh số trung bình mỗi tháng và sau đó loại trừ thành phần tháng:

{EXCLUDE [Order Date (Month / Year)] : AVG({FIXED [Order Date (Month / Year)] : SUM([Sales])})}

Lưu ý rằng đây là biểu thức LOD lồng nhau, nghĩa là một biểu thức xuất hiện bên trong một biểu thức khác.

Được lưu dưới dạng [average of sales by month], phép tính sau đó có thể được trừ cho tổng doanh số bán hàng mỗi tháng bằng một phép tính đặc biệt trên ngăn Rows:

Với Month([Order Date]) trên ngăn Columns sẽ tạo một view biểu diễn sự khác nhau giữa doanh số bán hàng thực tế mỗi tháng trong khoảng thời gian 4 năm và doanh số bán hàng trung bình hằng tháng trong toàn bộ giai đoạn 4 năm.

Ví dụ 2:

Biểu thức sau loại [Region] từ một phép tính của tổng [Sales]:

{EXCLUDE [Region]: SUM([Sales])}

Biểu thức được lưu dưới dạng [ExcludeRegion]. Để minh họa biểu thức này khá hữu dụng, đầu tiên xét view dưới đây, view đã chia tổng doanh số theo vùng và tháng:

Thả [ExcludeRegion] vào ô Color trong thẻ Marks, view sẽ mờ đi các thanh và hiển thị tổng doanh số theo tháng mà không có thành phần vùng (region).

Table-Scoped

Có thể xác định biểu thức LOD ở cấp độ bảng mà không cần sử dụng bất kỳ từ khóa xác định phạm vi nào. Ví dụ, biểu thức dưới đây trả về ngày đặt hàng tối thiểu (sớm nhất) cho toàn bộ bảng:

{MIN([Order Date])}

Điều này tương đương với biểu thức FIXED với không có dimension được khai báo:

{FIXED : MIN([Order Date])}

Bên cạnh đó, bạn đọc có thể tham khảo thêm về cú pháp biểu thức LOD tại đây.

Như vậy là chúng ta vừa hoàn tất việc tạo các loại biểu thức LOD trong Tableau. Đây cũng là một trong những chủ đề được cộng đồng phân tích dữ liệu Tableau đặc biệt quan tâm. Đừng quên theo dõi những bài viết mới sẽ được BAC cập nhật thường xuyên tại website bacs.vn. Ngoài ra, các bạn quan tâm lĩnh vực phân tích và trực quan dữ liệu đừng bỏ qua khóa học phân tích dữ liệu bằng Tableau tại BAC nhé.

Nguồn tham khảo: https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

 

Previous Post
Next Post