Kĩ năng cần thiết cho một nhà phân tích dữ liệu?

Cần trang bị những kỹ năng gì để trở thành một nhà phân tích dữ liệu (data analyst)? Làm thế nào để so sánh với các kỹ năng của các kỹ sư dữ liệu (data engineer) và nhà khoa học dữ liệu (data scientist)? Đó là những câu hỏi được nhiều bạn đọc của BAC quan tâm.

Một nhà phân tích dữ liệu cần nhiều kỹ năng công nghệ

Để trả lời cho những câu hỏi trên, chúng ta hãy cùng xem qua phân tích danh sách việc làm trực tuyến từ tháng 1 năm 2020. Phân tích được thực hiện bởi Jeff Hale – Top writer tại Technology, Artificial Intelligence chuyên viết các nội dung về khoa học dữ liệu (data science).

Dưới đây là Top 10 công nghệ hàng đầu từ danh sách công việc phân tích dữ liệu tính đến tháng 1 năm 2020.

Công nghệ từ danh sách công việc Data Analyst tháng 1 năm 2020

1. Vai trò của nhà phân tích dữ liệu

Những nhà phân tích dữ liệu chuyển đổi dữ liệu thành thông tin. Họ đóng một vai trò quan trọng trong việc giúp dữ liệu trở thành hành động cho những người đưa ra quyết định.

Các nhà phân tích dữ liệu thường nhận dữ liệu được cung cấp bởi các kỹ sư dữ liệu, phân tích chúng và đưa ra các khuyến nghị. Họ tạo ra các hình ảnh trực quan để hiển thị những khám phá trong dashboards và trình bày.

Không giống như các nhà khoa học dữ liệu, nhà phân tích dữ liệu không tạo ra các mô hình dự đoán dựa trên các thuật toán đám mây.

2. Phương pháp

Thông tin từ SimplyHired, Indeed và Monster, để xem các từ khóa xuất hiện cùng cụm từ “Data Analyst” trong danh sách công việc ở Mỹ. Jeff đã sử dụng thư viện Python Requests và Beautiful Soup. Sử dụng cùng từ khóa được lượm lặt từ phân tích về danh sách công việc của nhà khoa học dữ liệu và kỹ sư dữ liệu.

Khảo sát được thực hiện trên các trang web tìm kiếm việc làm phổ biến

Đối với mỗi website tìm kiếm việc làm, Jeff đã tính toán tỷ lệ phần trăm của tổng số danh sách công việc phân tích dữ liệu mà mỗi từ khóa xuất hiện. Sau đó, tính trung bình những tỷ lệ này trên 3 website cho mỗi từ.

3. Kết quả

Dưới đây là biểu đồ được mở rộng biểu thị 30 công nghệ phổ biến nhất.

 Top 30 công nghệ phổ biến trong danh sách công việc Data Analyst 2020

Biểu đồ dạng bảng với cùng dữ liệu

Biểu đồ ở dạng bảng so sánh 3 website

Nhiều từ khóa công nghệ khác đã được tìm kiếm và đây là 30 vị trí cao nhất. Hãy chú ý các công nghệ phổ biến nhất.

4. Thảo luận
  • SQL

SQL viết tắt của cụm từ Structured Query Language. Nó xuất hiện trong hơn một nửa của tất cả các danh sách. SQL được sử dụng để làm việc với các cơ sở dữ liệu quan hệ. SQL có nhiều loại bao gồm MySQL, Oracle, SQL Server, PostgreSQL và SQLite. Mỗi phiên bản chia sẻ hầu hết các API cốt lõi giống nhau và có dịch vụ miễn phí chất lượng.

  • Excel

Tương tự như SQL, Excel cũng khá phổ biến, nó là chương trình bảng tính chiếm ưu thế. Là một phần của bộ công cụ phần mềm Microsoft Office 365 dù nó không thể xử lý một lượng lớn dữ liệu như SQL nhưng Excel lại rất tốt để làm các phân tích nhanh. Google Sheets chính là đối thủ cạnh tranh trực tiếp với Excel, bao gồm phiên bản miễn phí và chức năng cốt lõi tương tự.

  • Tableau

Tableau xuất hiện trong khoảng một phần tư danh sách. Nó là một phần mềm kinh doanh thông minh bằng cách kéo thả, cho phép tạo các hình trực quan hóa dữ liệu và dashboards một cách dễ dàng.

Tính năng trực quan của Tableau vượt trội hơn hẳn so với Excel. Nó cũng bao gồm một phiên bản miễn phí nhưng nếu bạn muốn bảo mật dữ liệu bạn cần tốn thêm chi phí.

  • Python

Python xuất hiện trong khoảng một phần tư danh sách. Là một ngôn ngữ lập trình mã nguồn mở miễn phí để làm việc với dữ liệu, website và tập lệnh. Đây cũng là ngôn ngữ chính cho machine learning (học máy).

  • R

R được xuất hiện trong khoảng 20% danh sách. Nó cũng là một ngôn ngữ lập trình mã nguồn mở miễn phí cho thống kê, đặc biệt là trong giới học thuật.

5. So sánh với Data Engineer và Data Scientist

Tổng số danh sách là 16,325 cho Data Analyst, 12,013 cho Data Engineer và 9,396 cho Data Scientist. Vì thế, công việc phân tích dữ liệu là khá phổ biến. Biểu đồ dưới đây cho thấy 10 công nghệ phổ biến nhất cho danh sách phân tích dữ liệu. Bên cạnh đó, là kết quả của danh sách data scientist và data engineer cho mỗi từ khóa.

Biểu đồ từ khóa phổ biến cho Data Analyst, Data Scientist và Data Engineer

Một vài điểm nổi bật:

  • SQL phổ biến cho cả 3 vị trí công việc
  • Excel phổ biến hơn 4 lần trong danh sách phân tích dữ liệu so với danh sách nhà khoa học dữ liệu và kỹ sư dữ liệu.
  • Python được tìm thấy trong một phần tư danh sách phân tích dữ liệu nhưng lại gấp ba lần trong danh sách công việc khoa học dữ liệu và kỹ sư dữ liệu.
  • R ít phổ biến hơn trong phân tích dữ liệu và kỹ sư dữ liệu so với danh sách công việc khoa học dữ liệu.
  • PowerPoint phổ biến nhất trong danh sách phân tích dữ liệu.

Xét về xu hướng, phân tích của Jeff về danh sách công việc khoa học dữ liệu chỉ ra rằng cả R và SAS đều có mức giảm phổ biến lớn từ năm 2018 đến 2019. Đáng chú ý là có nhiều công nghệ đã được đề cập trong danh sách công việc kỹ sư dữ liệu hơn được đề cập trong danh sách công việc phân tích dữ liệu.

6. Lời khuyên

Tham gia các dự án thực tế để thu được kiến thức và kinh nghiệm

Nếu bạn muốn trở thành một nhà phân tích dữ liệu hoặc có giá trị trên thị trường việc làm. Jeff gợi ý bạn tìm hiểu các công nghệ sau theo thứ tự ưu tiên:

  • Excel, nhanh chóng tiếp cận hơn SQL, bạn có thể học Excel bằng cách học bài kiểm tra chứng chỉ Microsoft Excel. Nếu bạn là người tự học, hãy dành thời gian cho chứng chỉ chính thức hoặc khóa học MOOC.
  • SQL, nếu bạn không biết một ngôn ngữ lập trình, đây là một sự lựa chọn tốt để bắt đầu.
  • Tableau, cho phép bạn tạo ra các biểu đồ trực quan tuyệt vời một cách nhanh chóng bằng giao diện kéo thả.
  • Bạn cũng có thể học thêm PowerPoint để học cách trình bày, có nhiều khóa học MOOC dạy Microsoft PowerPoint.

Nếu bạn đã chứng minh bạn có thể sử dụng các công nghệ trên để phân tích và giao tiếp, bạn sẽ là một ứng cử viên sáng giá cho nhiều vị trí đầu vào.

Nếu đã biết những kỹ năng trên và muốn học thêm những điều mới hoặc chất lượng cho nhiều vị trí công việc, đừng bỏ qua Python. Python thì rất tuyệt vời nếu bạn muốn chuyển sang kỹ sư dữ liệu hoặc khoa học dữ liệu.

Sau khi đã học Python, lựa chọn tiếp được khuyến nghị đó là Pandas. Pandas là một thư viện của Python để làm việc với dữ liệu, nếu bạn đang tìm một công việc dữ liệu yêu cầu Python, bạn chắc chắn không thể bỏ qua kỹ năng pandas.

Ngoài việc học và trang bị các kỹ năng công nghệ trên, bạn nên thực hiện các dự án mà bạn có thể đưa vào hồ sơ cá nhân khi ứng tuyển. Sau đó, bạn sẽ được học bằng cách làm công việc mà bạn yêu thích. Và bạn cũng có một hồ sơ đẹp với các kỹ năng cần thiết khi gặp nhà tuyển dụng.

Trên đây là bài viết được BAC biên dịch dành cho bạn đọc yêu thích và có nhu cầu học tập, nghiên cứu lĩnh vực phân tích dữ liệu. Để được tư vấn lộ trình học và các khóa học phù hợp với nhu cầu, trình độ, công việc hãy liên hệ ngay cho BAC theo số Hotline: 0909 310 768 hoặc tham khảo lịch khai giảng các khóa học mới nhất.

Nguồn: towardsdatascience.com

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

 

Previous Post
Next Post
Exit mobile version