• 0945 09 09 08
  • support@hspace.vn

THỊ GIÁC MÁY TÍNH VỚI PYTHON

Thời gian: Thời lượng: 30
Thời lượng 30 Credits
Danh mục Thị giác máy tính

Mục tiêu của khoá học “Thị giác máy tính sử dụng Python” là trang bị cho người học nền tảng và kỹ năng (lập trình Python) để giải quyết các bài toán cơ bản trong thị giác máy tính, tạo cơ sở để đi vào nghiên cứu chuyên sâu về thị giác máy tính. Người học sẽ học lập trình thông qua giải quyết vấn đề trong Python, báo gồm quy trình phát triển phần mềm: phân tích, thiết kế, lập trình, kiểm thử và phong cách lập trình hướng đối tượng chuyên nghiệp. Cung cấp các công cụ toán học cơ bản cần thiết để hình thành các kỹ thuật, phương pháp xử lý ảnh và video, các khái niệm và kỹ thuật này được truyền đạt thông qua các vấn đề thực tiễn sử dụng Python. Khóa học đưa người học lần lượt đi qua các bước trong quy trình xây dựng một ứng dụng thị giác máy tính, từ thu thập hình ảnh, xử lý hình ảnh, trích xuất đặc trưng, xây dựng, huấn luyện và đánh giá các thuật toán, mô hình xử lý ảnh cho đến hoàn thiện một ứng dụng sử dụng xử lý ảnh, video. Các thuật ngữ trừu tượng, chi tiết công thức và mô hình phức tạp được trình bày lại một cách dễ hiểu, được giải thích bằng các ví dụ thực tiễn sử dụng các thư viện trong Python để triển khai. Ngoài các kỹ thuật xử lý, trích xuất thông tin từ hình ảnh, video người học còn được tiếp cận với các thuật toán học máy (machine learning), học sâu (deep learning) được áp dụng vào các bài toán cơ bản trong thị giác máy tính. Nhằm tránh việc đi sâu vào xây dựng thuật toán, các thư viện được sử dụng rộng rãi như Numpy, OpenCV, Pillow, Scikit-image, Scikit-learn, Keras được giới thiệu nhằm giúp người học hiểu nhanh các thuật toán và xây dựng các ứng dụng xử lý ảnh và video.

 

Mô-đun 1. Ngôn ngữ lập trình Python
Mô-đun này cung cấp cho sinh viên nền tảng lập trình Python mà không cần bất kỳ điều kiện tiên quyết nào. Cụ thể, mô-đun này trình bày các kiến thức cơ bản về lập trình bao gồm các kiểu dữ liệu, cấu trúc điều khiển, thiết kế thuật toán, các nguyên tắc cơ bản của lập trình hướng đối tượng và vòng đời phát triển phần mềm (phân tích, thiết kế, phát triển, thử nghiệm, triển khai và bảo trì) với môi trường lập trình Python. Hơn nữa, đào tạo người học các kỹ thuật xử ảnh, video chuyên sâu. Nội dung đào tạo được thực hiện bằng cách hướng dẫn sinh viên giải quyết vấn đề bằng Python, khám phá các thách thức phát triển phần mềm trong thế giới thực và tạo ra các ứng dụng thực tế và thông minh.

 

Mô-đun 2. Nền tảng toán học
Mô-đun này cung cấp một cái nhìn tổng quan ngắn gọn về các công cụ toán học cơ bản cần thiết cho các khóa học tiếp theo của chương trình khoa học dữ liệu. Các chủ đề bao gồm Đại số, Giải tích, Xác suất và Thống kê. Để dễ dàng cho người học hiểu các khái niệm và kỹ thuật toán học, mô-đun này tránh đề cập các chứng minh và công thức toán học quá chi tiết không cần thiết, và tập trung vào các ví dụ của chúng từ các ứng dụng trong thế giới thực được thực hiện bằng Python.

 

Mô-đun 3. Thị giác máy tính với Python

Mô-đun này tập trung vào các kỹ thuật xử lý, trích xuất đặc trưng từ hình ảnh và các bài toán cơ bản trong thị giác máy tính. Các kỹ thuật xử lý ảnh được trình bày gồm các phép biến đổi hình học, chuyển đổi giữa các không gian màu, lọc nhiễu, cân bằng độ sáng, kỹ thuật chọn ngưỡng, lọc ảnh, phát hiện góc, phát hiện cạnh. Các kỹ thuật trích xuất đặc trưng hình ảnh theo điểm đặc biệt, cạnh, góc, vùng ảnh được sử dụng để áp dụng trực tiếp vào các bài toán phổ biến như phát hiện, phân vùng, nhận dạng đối tượng. 

 

Mô-đun 4. Học máy cho thị giác máy tính với Python

Các thuật toán học máy như KNN, K-means, Support Vector Machines,… được trình bày một cách ngắn gọn, dễ hiểu thông qua các ví dụ thực tiễn sử dụng các thư viện Python để phát triển. Cụ thể, các thuật toán này được cài đặt dựa theo các thư viện Scikit-learn, Keras và áp dụng trực tiếp vào các bài toán xử lý ảnh, video trong thực tiễn, điều này giúp người học tiếp cận lĩnh vực học máy trong thị giác máy tính một cách nhanh chóng. Các thuật toán Deep learning như CNN, LeNet, VGG cũng được giới thiệu với kỹ thuật cài đặt trên các máy tính có hỗ trợ GPU dựa vào các thư viện của Python và áp dụng trực tiếp vào các bài toán thực tiễn.

Đội ngũ hSpace

Đội ngũ hSpace

Lĩnh Vực chuyên sâu

Sau khi học xong khoá học này:

· Người học có kỹ năng lập trình hướng đối tượng với Python và vận dụng trong giải quyết các vấn đề thực tế với quy trình phát triển phần mềm.

· Có nền tảng toán học cơ bản và vận dụng vào trích xuất thông tin từ hình ảnh, videosử dụng ngôn ngữ Python.

· Người học có kiến thức, kỹ năng về thị giác máy tính, và ứng dụng vào giải quyết các vấn đề thực tiến sử dụng ngôn ngữ Python.

· Người học có kiến thức, kỹ năng và phương pháp học máy, vận dụng vào xây dựng và huấn luyện mô hình học máy cho các vấn đề trong thị giác máy tính như phát hiện đối tượng, phân vùng và nhận dạng đối tượng.

· Với các kiến thức và kỹ năng trên, người học có nền tảng và năng lực để tiếp tục học/tự học, nghiên cứu trong lĩnh vực thị giác máy tính.