Định luật Benford là một định luật toán học tuyên bố rằng chữ số đứng đầu hoặc ngoài cùng bên trái trong nhiều nguồn dữ liệu thực được phân phối theo một cách rất cụ thể. Số 1 là số đứng đầu khoảng 30% thời gian trong khi các số lớn hơn lại càng ít đứng đầu hơn với số 9 chỉ xuất hiện ít hơn 5%.
Khi dữ liệu bị ngụy tạo, những kẻ lừa đảo có thể không biết để tạo ra dữ liệu giả theo luật Benford. Trong một số trường hợp, điều này có thể phát hiện dữ liệu giả hoặc ít nhất là nghi ngờ tính trung thực của nó.
Bài viết này sẽ miêu tả cách áp dụng định luật Benford vào dữ liệu doanh số (Sales). Chúng ta sẽ sử dụng dữ liệu mẫu Sample – Superstore có sẵn trong Tableau Desktop. Dưới đây là các bước cần thực hiện:
1. Tạo calculated fields để sử dụng trong view
Bước 1: Trong menu Analysis, chọn Create Calculated Field để mở trình chỉnh sửa phép tính. Đặt tên cho phép tính là Leftmost Integer và nhập dòng sau vào ô công thức:
LEFT(STR([Sales]),1)
Bước 2: Tạo một calculated field thứ hai và đặt tên nó là Benford Law. Nhập hoặc sao chép và dán dòng sau vào ô công thức:
LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))
2. Cài đặt view
Bước 1: Từ thanh Data, kéo Leftmost Integer vào Columns và sau đó kéo Orders(Count) vào Rows.
Bước 2: Nhấp vào CNT(Orders) trên Rows và chọn Quick Table Calculation > Percent of Total.
View của bạn bây giờ biểu diễn sự phân phối của các chữ số đầu tiên và kích thước của các thanh (giảm từ trái sang phải) cho thấy dữ liệu trong trường hợp này đang tuân theo định luật Benford. Nhưng chúng ta có thể làm nhiều hơn để đóng khung dữ liệu bằng cách thêm các bản phân phối tham chiếu.
Bước 3: Từ thanh Data, kéo Benfords Law vào ô Detail trên thẻ Marks. Nhấp vào Benford Law trên thẻ Marks và chọn Measure > Minimum.
Bước 4: Chuyển đổi từ thanh Data đến thanh Analytics và kéo Distribution Band vào view. Thả nó vào ô Cell.
Lưu ý: Distribution Bands được hỗ trợ trên nền tảng web bắt đầu từ Tableau 10.2.
Bước 5: Trong hộp thoại Edit Reference Line, Band, or Box, làm những việc sau:
a. Nhấp vào trường Value để xem các tùy chọn bổ sung:
b. Trong khu vực Percentages, nhập 80,100,120.
Điều này chỉ định rằng bạn muốn các bands trải dài từ 80 đến 100 phần trăm và từ 100 đến 120 phần trăm. Tiếp theo, bạn sẽ chỉ định giá trị phần trăm đang tham chiếu.
c. Trong trường Percent of, chọn MIN(Benfords Law).
Trường Value bây giờ sẽ đọc 80%,100%,120% of Average Min. Benfords Law.
Các bước còn lại cấu hình sự xuất hiện của các reference bands.
d. Đặt Label là None.
e. Đặt Line thành dòng mỏng nhất hiện có.
f. Chọn Fill Below.
g. Từ Fill, chọn Stoplight.
h. Nhấn OK để thoát khỏi hộp thoại Edit Reference Line, Band, or Box.
Bước 6: Nhấn vào nút có biểu tượng chữ T trên thanh công cụ để hiển thị mark labels.
Sau khi hoàn tất, bạn sẽ thu được một view tương tự như dưới đây:
Mặc dù, Superstore là dữ liệu mẫu nhưng nó vẫn tuân theo định luật Benford. Các thanh màu xanh lam biểu thị tỷ lệ phần trăm thực tế của các chữ số ban đầu sắp xếp rất phù hợp với giá trị 100% (nghĩa là, đường phân tách vùng màu xanh lục với vùng màu vàng trong các dải phân phối) hiển thị các giá trị Benford dự kiến trong view.
Bằng cách áp dụng định luật Benford, bạn có thể nhanh chóng kiểm tra tính xác thực của dữ liệu. Toàn bộ thao tác thực hiện trên Tableau khá nhanh chóng và chính xác. Mong rằng những kiến thức được BAC chia sẻ trên đây sẽ hữu ích với bạn đọc, đừng quên theo dõi các bài viết mới tại website bacs.vn.
Nguồn tham khảo:
https://help.tableau.com/
Nhu cầu đào tạo doanh nghiệp
BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Các bài viết liên quan Power BI:
- Power BI cơ bản cho người mới bắt đầu
- Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
- Kết hợp dữ liệu trong Power BI Desktop
- Hướng dẫn kết nối dữ liệu trong Power BI Desktop
- Hướng dẫn tải & cài đặt Power BI trên máy tính
- Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
- Power BI là gì?
Các bài viết liên quan:
- TABLEAU – Giải pháp BUSINESS INTELLIGENCE (BI) – click vào đây
- Hướng dẫn cài đặt và Sử dụng TABLEAU – click vào đây
- Tính năng mới trên tableau – verion 2019.1 – click vào đây
BAC – Biên soạn và tổng hợp nội dung