Đề cương khóa học
Cơ bản và trung cấp về Python cho các tác vụ dữ liệu với Pandas và Polars
- Cài đặt Python và thiết lập môi trường phát triển
- Cơ bản ngôn ngữ: biến, kiểu dữ liệu, cấu trúc điều khiển
- Viết và chạy các script Python đơn giản
Xử lý tệp: CSV và Excel
- Đọc và ghi tệp CSV bằng module csv và Pandas
- Làm việc với tệp Excel bằng openpyxl/xlrd và Pandas
- Bài tập thực hành: tự động hóa chuyển đổi tệp
Giới thiệu về Pandas
- Cơ bản DataFrame: tạo, chỉ mục, chọn lọc, và lọc dữ liệu
- Các phép toán tổng hợp và nhóm dữ liệu
- Các thao tác làm sạch dữ liệu thông dụng: giá trị thiếu, trùng lặp, và chuyển đổi kiểu dữ liệu
Giới thiệu về Polars
- Các khái niệm và đặc tính hiệu suất của Polars so với Pandas
- Các thao tác cơ bản với DataFrame trong Polars
- Ví dụ về trường hợp sử dụng: khi nào chọn Polars thay vì Pandas
Chuyển đổi dữ liệu nâng cao (Trung cấp)
- Các phép nối phức tạp, hàm cửa sổ, và các phép chuyển đổi trong Pandas
- Các mẫu xử lý dữ liệu hiệu quả với Polars
- Xâu chuỗi các thao tác và tối ưu hóa sử dụng bộ nhớ
Tự động hóa quy trình với Python
- Viết script để tự động hóa các tác vụ dữ liệu và các bước ETL lặp đi lặp lại
- Đặt lịch cho script bằng các trình điều khiển OS hoặc trình điều khiển nhiệm vụ
- Nhật ký, xử lý lỗi, và thông báo
Gói script và các thao tác tốt nhất
- Tạo các thực thi được với PyInstaller hoặc các công cụ tương tự
- Cấu trúc dự án, môi trường ảo, và quản lý phụ thuộc
- Cơ bản về kiểm soát phiên bản và tài liệu hóa quy trình làm việc
Dự án thực hành mini
- Nhiệm vụ từ đầu đến cuối: đọc các tệp nguyên, làm sạch và chuyển đổi dữ liệu, tạo ra các đầu ra
- Tự động hóa quy trình và gói thành một script hoặc thực thi có thể chạy được
- Đánh giá và cải thiện dựa trên phản hồi của đồng nghiệp
Tóm lược và các bước tiếp theo
Yêu cầu
- Sơ lược về các khái niệm lập trình hoặc sẵn lòng học
- Tiện dùng dòng lệnh hoặc terminal để cài đặt gói
- Kinh nghiệm làm việc với bảng tính (CSV/Excel)
Đối tượng học viên
- Nhân viên phân tích dữ liệu và nhân viên hoạt động tự động hóa công việc dữ liệu
- Nhân viên kỹ thuật phân tích tìm kiếm scripting ETL nhẹ
- Cá nhân quan tâm đến các luồng dữ liệu thực tiễn dựa trên Python
Đánh giá (5)
Việc có nhiều bài tập thực hành hơn sử dụng dữ liệu tương tự như chúng ta dùng trong các dự án của mình (hình ảnh vệ tinh ở định dạng raster)
Matthieu - CS Group
Khóa học - Scaling Data Analysis with Python and Dask
Dịch thuật bằng máy
Tôi nghĩ giảng viên rất am hiểu và trả lời câu hỏi với sự tự tin để làm rõ hiểu biết.
Jenna - TCMT
Khóa học - Machine Learning with Python – 2 Days
Dịch thuật bằng máy
Đánh giá rất tốt về sự chuẩn bị và chuyên môn của giảng viên, giao tiếp tiếng Anh hoàn hảo. Khóa học mang tính thực hành cao (bài tập + chia sẻ các ví dụ về trường hợp sử dụng)
Monika - Procter & Gamble Polska Sp. z o.o.
Khóa học - Developing APIs with Python and FastAPI
Dịch thuật bằng máy
Giải thích
Wei Yang Teo - Ministry of Defence, Singapore
Khóa học - Machine Learning with Python – 4 Days
Dịch thuật bằng máy
Giảng viên phát triển khóa học dựa trên tốc độ của người tham gia
Farris Chua
Khóa học - Data Analysis in Python using Pandas and Numpy
Dịch thuật bằng máy