Làm mới các trích xuất trong Tableau Desktop

Khi thay đổi dữ liệu gốc, bạn có thể làm mới trích xuất (extract) bằng Tableau Desktop, chọn một nguồn dữ liệu trên menu Data và sau đó chọn Extract > Refresh. Các trích xuất có thể được cấu hình để làm mới đầy đủ, thay thế tất cả dữ liệu bằng dữ liệu gốc hoặc làm mới tăng dần (incremental refresh) chỉ thêm các dòng mới kể từ lần làm mới trước đó.

Lưu ý: Bạn cũng có thể làm mới trích xuất bằng Tableau Data Extract Command Line Utility.

1. Trước khi làm mới trích xuất

Trước khi làm mới, bạn cần lưu ý đến định dạng tệp, nếu bạn làm mới trên một trích xuất .tde phiên bản 2021.1, nó sẽ tự động cập nhật lên .hyper. Trong khi có nhiều lợi ích từ việc cập nhật lên một trích xuất. hyper, bạn không thể mở trích xuất bằng các phiên bản trước của Tableau Desktop.

2. Cấu hình làm mới trích xuất đầy đủ

Mặc định, các trích xuất được cấu hình làm mới đầy đủ, nghĩa là mỗi lần làm mới, tất cả các dòng sẽ được thay thế bằng dữ liệu trong nguồn dữ liệu gốc. Mặc dù, điều này đảm bảo một bản sao chính xác của dữ liệu gốc, tùy vào kích thước của phần trích xuất, việc làm mới toàn bộ có thể gây tốn kém thời gian và cơ sở dữ liệu.

Nếu một trích xuất không được cấu hình làm mới tăng dần, việc làm mới sẽ thực hiện làm mới toàn bộ.

2.1 Xuất bản lên Tableau Server

Nếu bạn muốn xuất bản một trích xuất như một nguồn dữ liệu lên Tableau Server, bạn có thể lên lịch làm mới trong khi xuất bản.

Tương tự, nếu bạn xuất bản một trích xuất trong một workbook lên Tableau Server, bạn cũng có thể xác định một lịch trình làm mới trích xuất khi xuất bản.

2.2 Xuất bản lên Tableau Online

Nếu bạn muốn xuất bản một trích xuất như một nguồn dữ liệu lên Tableau Online, tùy chọn làm mới mà bạn có sẽ phụ thuộc vào đặc điểm của nguồn dữ liệu.

3. Cấu hình làm mới tăng dần

Hầu hết nguồn dữ liệu đều hỗ trợ làm mới tăng dần, thay vì làm mới toàn bộ, bạn có thể cấu hình làm mới bằng cách chỉ thêm các dòng mới kể từ lần làm mới trước. Ví dụ, bạn có nguồn dữ liệu được cập nhật hằng ngày với các giao dịch bán hàng mới. Thay vì xây dựng lại toàn bộ mỗi ngày, bạn chỉ cần thêm các giao dịch mới xảy ra vào ngày hôm đó và làm mới toàn bộ vào cuối tuần.

Lưu ý: Nếu cấu trúc dữ liệu của nguồn dữ liệu thay đổi (ví dụ, một cột mới được thêm vào), bạn cần làm mới toàn bộ trước khi làm mới tăng dần. Dưới đây là thao tác làm mới tăng dần:

  • Bước 1: Chọn một nguồn dữ liệu trên menu Data và chọn Extract Data.
  • Bước 2: Trong hộp thoại Extract Data, chọn All rows là số lượng dòng để trích xuất. Làm mới từng bước có thể chỉ xác định khi bạn trích xuất tất cả các dòng trong cơ sở dữ liệu. Bạn không thể tăng các trích xuất mẫu.
  • Bước 3: Chọn Incremental refresh và chọn một cột trong cơ sở dữ liệu sẽ được dùng để xác định các hàng mới.

Ví dụ, bạn chọn một trường Date, làm mới sẽ thêm tất cả các dòng có ngày sau lần cuối bạn làm mới. Ngoài ra, bạn có thể dùng cột ID tăng lên khi có các hàng được thêm vào cơ sở dữ liệu.

Lưu ý: Công cụ dữ liệu là cơ chế cơ bản mà Tableau dùng để tạo trích xuất, lưu trữ giá trị thời gian với độ chính xác lên đến 3 chữ số thập phân. Nếu bạn chỉ định một cột ngày giờ hoặc dấu thời gian cho Identify new rows using column và cơ sở dữ liệu của bạn dùng một độ chính xác cao hơn Tableau, bạn có thể kết thúc các dòng trùng lặp sau khi làm mới gia tăng.

Ví dụ, nếu cơ sở dữ liệu có 2 dòng, một dòng giá trị ngày giờ 2015-03-13 17:30:56.502352 và một dòng với giá trị ngày giờ 2015-03-13 17:30:56.502852, Tableau sẽ lưu trữ cả hai dòng bằng một giá trị ngày giờ 2015-03-13 17:30:56.502, từ đó tạo ra các hàng trùng lặp.

  • Bước 4: Khi hoàn tất, nhấn Extract.

Các bước trên có thể được dùng để xác định một extract mới hoặc chỉnh sửa một extract đang tồn tại cho một làm mới tăng dần. Nếu bạn sửa một extract đang tồn tại, lần làm mới cuối cùng được hiển thị để bạn có thể chắc chắn rằng bạn đang cập nhật phần trích xuất với dữ liệu chính xác.

4. Xem lịch sử trích xuất

Bạn có thể xem lịch sử của các trích xuất được tạo bằng cách chọn nguồn dữ liệu trên menu Data và chọn Extract > History.

Hộp thoại Extract History hiển thị ngày tháng và thời gian cho mỗi lần làm mới, làm mới toàn bộ hay gia tăng, số dòng được thêm vào. Nếu làm mới từ một tệp, tên tệp nguồn sẽ được cung cấp.

Như vậy là chúng ta đã biết thế nào là làm mới trích xuất và hai kiểu làm mới trong Tableau Desktop. Trong thế giới dữ liệu, việc cập nhật nhanh chóng, chính xác là yếu tố rất quan trọng, hãy dành nhiều thời gian để tìm hiểu và thực hành các thao tác trên nhé. Những nội dung mới nhất sẽ được cập nhật thường xuyên tại BAC’s Blog, đừng quên đón đọc.

Nguồn tham khảo:
https://help.tableau.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

Các bài viết liên quan Power BI: 

    Các bài viết liên quan: 

    • TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
    • Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
    • Tính năng mới trên tableau – verion 2019.1 – click vào đây

    BAC – Biên soạn và tổng hợp nội dung

     

    Previous Post
    Next Post