Tối ưu dữ liệu cho Ask Data trong Tableau (Phần 2)

Để mang đến những trải nghiệm tốt nhất cho người dùng Ask Data, bạn có thể tối ưu nguồn dữ liệu gốc.

Tham khảo: Tối ưu dữ liệu cho Ask Data trong Tableau (Phần 1)

Lưu ý: Ask Data không hỗ trợ các nguồn dữ liệu khối đa chiều hoặc các nguồn dữ liệu không liên quan như Google Analytic.

1. Tối ưu chỉ mục cho Ask Data

Những người sở hữu nguồn dữ liệu có thể thay đổi thời gian lập chỉ mục cho Ask Data, tối ưu hiệu suất hệ thống.

  • Bước 1: Ở trên của trang nguồn dữ liệu, nhấn vào biểu tượng Detail.

  • Bước 2: Trong phần Ask Data, chọn Edit.
  • Bước 3: Chọn một tùy chọn lập chỉ mục cho các giá trị trường:

    • Automatic (tự động) kiểm tra thay đổi sau mỗi 24 giờ và phân tích nguồn dữ liệu nếu nó trực tiếp, có trích xuất được làm mới hoặc được xuất bản lại. Chọn tùy chọn này khi một nguồn dữ liệu thường xuyên được sử dụng với Ask Data, để nó luôn sẵn sàng khi người dùng cần.
    • Manual (thủ công) phân tích nguồn dữ liệu chỉ khi Tableau creators kích hoạt lập chỉ mục thủ công trên trang nguồn dữ liệu. Chọn tùy chọn này nếu nguồn dữ liệu thay đổi thường xuyên nhưng người dùng thỉnh thoảng vẫn truy vấn nó với Ask Data.

Để kích hoạt lập chỉ mục thủ công, đi đến trang nguồn dữ liệu, nhấp vào chữ “i” được khoanh tròn trong ngăn Data bên trái và chọn Reindex Data Source.

Disabled (vô hiệu) phân tích chỉ tên trường, không phân tích giá trị.

  • Bước 4: Nhấn Save.
2. Sử dụng trích xuất dữ liệu cải thiện hiệu suất

Để cải thiện hiệu suất và hỗ trợ các tập dữ liệu lớn, bạn hãy sử dụng Ask Data với các trích xuất đã xuất bản thay vì các nguồn dữ liệu trực tiếp.

3. Đảm bảo người dùng có thể truy cập vào nguồn dữ liệu

Để dùng Ask Data, người dùng phải có quyền kết nối vào nguồn dữ liệu. Nếu một nguồn dữ liệu có phân quyền cấp hàng, những quyền đó cũng áp dụng với Ask Data. Dữ liệu này sẽ không nhận ra các giá trị an toàn hoặc đưa ra các đề xuất thống kê liên quan.

4. Lưu ý về các tính năng nguồn dữ liệu không được hỗ trợ

Ask Data hỗ trợ tất cả các tính năng nguồn dữ liệu Tableau ngoại trừ những mục dưới đây. Trường hợp nguồn dữ liệu của bạn chứa chúng, người dùng Ask Data sẽ không thể truy vấn các trường liên quan.

  • Sets
  • Combined fields
  • Parameters
  • Table calculations trong calculated fields
5. Dự đoán câu hỏi người dùng

Dự đoán loại câu hỏi người dùng sẽ hỏi và tối ưu nguồn dữ liệu cho các câu hỏi bằng những kỹ thuật này:

  • Làm sạch và định hình dữ liệu trong Tableau Prep hoặc công cụ tương tự.
  • Join data (dữ liệu nối) để bao gồm tất cả các trường mà người dùng có thể có câu hỏi về một bảng và cải thiện hiệu suất.
  • Thêm calculated field vào câu trả lời cho những câu hỏi phổ biến của người dùng.
  • Tạo bin có kích thước phù hợp cho các biến định lượng mà người dùng có thể muốn xem dưới dạng biểu đồ hoặc một bin khác.
6. Đơn giản hóa dữ liệu

Để giúp dữ liệu dễ hiểu cho cả người dùng và Ask Data, bạn hãy đơn giản hóa nguồn dữ liệu.

  • Bước 1: Xóa các trường không cần thiết.
  • Bước 2: Đặt một cái tên ý nghĩa và duy nhất cho mỗi trường.

    • Ví dụ, nếu có 5 tên trường bắt đầu bằng “Sales…”, hãy phân biệt tốt hơn để Ask Data có thể diễn giải đúng thuật ngữ “sales”.
    • Đổi tên “Number of records” thành một cái tên ý nghĩa. Ví dụ, sử dụng “Number of earthquakes” trong một nguồn dữ liệu trong đó mỗi bản ghi là một trận đồng đất.
    • Tránh đặt tên trường là số, ngày tháng hoặc các giá trị boolean (“true” hoặc “false”).
    • Tránh các tên giống với những cụm từ phân tích như “Sales in 2015” hoặc “Average Products Sold”.
  • Bước 3: Tạo những bí danh ý nghĩa cho những giá trị trường, phản ánh các thuật ngữ mọi người sẽ dùng trong cuộc đàm thoại.
7. Đặt giá trị mặc định cho trường thích hợp

Để giúp Ask Data phân tích dữ liệu đúng, đảm bảo các cài đặt trường mặc định phản ánh nội dung mỗi trường.

Thiết lập loại dữ liệu cho text (văn bản), time (thời gian), date (ngày tháng), geographic (địa lý), và các giá trị khác.

Chỉ định vai trò dữ liệu thích hợp: dimension hoặc measure, continous hoặc discrete.

Đối với mỗi measure, chỉ định các cài đặt mặc định thích hợp trong Tableau Desktop như color, sort order, number format (percentage, currency,…) và chức năng tổng hợp. Ví dụ, SUM có thể phù hợp cho “Sales” nhưng AVERAGE có thể là một mặc định tốt hơn cho “Test Score”.

Mẹo: Đặc biệt hữu ích khi đặt nhận xét mặc định cho từng trường, vì những nhận xét này xuất hiện dưới dạng mô tả thông tin khi người dùng di chuột qua các trường trong Ask Data.

8. Tạo phân cấp cho các trường địa lý và phân loại

Đối với dữ liệu thời gian, Tableau tự động tạo cấu trúc phân cấp, cho phép người dùng nhanh chóng xem chi tiết trong trực quan (ví dụ, từ ngày sang tuần qua tháng). Đối với dữ liệu phân loại và địa lý, bạn nên tạo cấu trúc phân cấp tùy chỉnh để giúp Ask Data tạo ra các trực quan phản ánh mối quan hệ giữa các trường. Lưu ý, Ask Data không hiển thị phân cấp trong thanh data.

Ask Data không lập chỉ mục tên phân cấp, chỉ tên của các trường trong hệ thống phân cấp. Ví dụ, nếu phân cấp địa lý có “Location” chứa “Country” và “City”, người dùng nên nhập “Country” và “City” trong câu hỏi của họ cho Ask Data.

9. Tránh tên trường mà Ask Data sử dụng các hàm phân tích

Để cho phép người dùng đặt câu hỏi về dữ liệu theo phong cách hội thoại, Ask Data dành những từ sau cho các chức năng phân tích. Nếu bất kỳ từ nào trong số này xuất hiện dưới dạng tên trường trong dữ liệu của bạn, hãy sửa nó.

Lưu ý: Ngoài các thuật ngữ trong phần Aggregation terms tại đây, Ask Data còn bảo lưu tất cả các liên từ, giới từ và các loại trực quan như Bar (biểu đồ thanh).

Qua hai phần của bài viết, BAC đã hướng dẫn bạn đọc hai cách tối ưu dữ liệu cho Ask Data và tối ưu dữ liệu trong Ask Data và tối ưu nguồn dữ liệu. Hy vọng bài viết đã mang đến những thông tin hữu ích cho các bạn, vẫn còn rất nhiều nội dung thú vị sẽ được cập nhật thường xuyên tại BAC’s Blog, đừng quên đón đọc.

Nguồn tham khảo:
https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

Các bài viết liên quan: 

  • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
  • Tính năng mới trên tableau – verion 2019.1 – click vào đây

BAC – Biên soạn và tổng hợp nội dung

 

Previous Post
Next Post