Đề cương khóa học

Cơ bản và trung cấp về Python cho các tác vụ dữ liệu với Pandas và Polars

  • Cài đặt Python và thiết lập môi trường phát triển
  • Cơ bản ngôn ngữ: biến, kiểu dữ liệu, cấu trúc điều khiển
  • Viết và chạy các script Python đơn giản

Xử lý tệp: CSV và Excel

  • Đọc và ghi tệp CSV bằng module csv và Pandas
  • Làm việc với tệp Excel bằng openpyxl/xlrd và Pandas
  • Bài tập thực hành: tự động hóa chuyển đổi tệp

Giới thiệu về Pandas

  • Cơ bản DataFrame: tạo, chỉ mục, chọn lọc, và lọc dữ liệu
  • Các phép toán tổng hợp và nhóm dữ liệu
  • Các thao tác làm sạch dữ liệu thông dụng: giá trị thiếu, trùng lặp, và chuyển đổi kiểu dữ liệu

Giới thiệu về Polars

  • Các khái niệm và đặc tính hiệu suất của Polars so với Pandas
  • Các thao tác cơ bản với DataFrame trong Polars
  • Ví dụ về trường hợp sử dụng: khi nào chọn Polars thay vì Pandas

Chuyển đổi dữ liệu nâng cao (Trung cấp)

  • Các phép nối phức tạp, hàm cửa sổ, và các phép chuyển đổi trong Pandas
  • Các mẫu xử lý dữ liệu hiệu quả với Polars
  • Xâu chuỗi các thao tác và tối ưu hóa sử dụng bộ nhớ

Tự động hóa quy trình với Python

  • Viết script để tự động hóa các tác vụ dữ liệu và các bước ETL lặp đi lặp lại
  • Đặt lịch cho script bằng các trình điều khiển OS hoặc trình điều khiển nhiệm vụ
  • Nhật ký, xử lý lỗi, và thông báo

Gói script và các thao tác tốt nhất

  • Tạo các thực thi được với PyInstaller hoặc các công cụ tương tự
  • Cấu trúc dự án, môi trường ảo, và quản lý phụ thuộc
  • Cơ bản về kiểm soát phiên bản và tài liệu hóa quy trình làm việc

Dự án thực hành mini

  • Nhiệm vụ từ đầu đến cuối: đọc các tệp nguyên, làm sạch và chuyển đổi dữ liệu, tạo ra các đầu ra
  • Tự động hóa quy trình và gói thành một script hoặc thực thi có thể chạy được
  • Đánh giá và cải thiện dựa trên phản hồi của đồng nghiệp

Tóm lược và các bước tiếp theo

Yêu cầu

  • Sơ lược về các khái niệm lập trình hoặc sẵn lòng học
  • Tiện dùng dòng lệnh hoặc terminal để cài đặt gói
  • Kinh nghiệm làm việc với bảng tính (CSV/Excel)

Đối tượng học viên

  • Nhân viên phân tích dữ liệu và nhân viên hoạt động tự động hóa công việc dữ liệu
  • Nhân viên kỹ thuật phân tích tìm kiếm scripting ETL nhẹ
  • Cá nhân quan tâm đến các luồng dữ liệu thực tiễn dựa trên Python
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (5)

Các khóa học sắp tới

Các danh mục liên quan