CHUẨN BỊ VÀ THỰC HÀNH
TẬP LUYỆN CHO IOAI
Ban Tổ Chức nhận thấy rằng AI thông thường không được đưa vào chương trình giảng dạy trên toàn thế giới, nên dưới đây BTC đưa ra một số tài nguyên sẽ hữu ích giúp các thí sinh chuẩn bị cho kỳ thi IOAI. Ngoài ra, BTC sẽ cung cấp một khóa học trực tuyến miễn phí cho tất cả những thí sinh trước khi công bố các bài toán của vòng Khoa học. Sáng kiến này đảm bảo rằng mọi người tham gia đều có cơ hội đạt được kiến thức nền tảng về AI, tạo sân chơi bình đẳng và làm phong phú thêm kinh nghiệm của học sinh trong cuộc thi.
NHỮNG KỸ NĂNG THIẾT YẾU
Các đội tuyển ở IOAI sẽ được sẽ phải có kiến thức về các lĩnh vực AI, ngôn ngữ lập trình với các nội dung cần lưu ý:
Python
Python là ngôn ngữ lập trình chính được sử dụng để phát triển các mô hình học máy. Đây là ngôn ngữ lập trình cấp cao, được những người thực hành AI ưa thích vì cú pháp trực quan và sự hỗ trợ cộng đồng rộng rãi, cùng nhiều lợi ích khác.
Hãy xem hướng dẫn Python sử dụng Google Colab, một nền tảng điện toán tương tác, nơi học sinh có thể thực thi mã Python trực tiếp trong trình duyệt. Google Colab hỗ trợ mã đơn giản như mã được trình bày trong hướng dẫn cũng như mã phức tạp hơn nhiều để xây dựng và đào tạo các mô hình máy học.
Truy cập:
PyTorch
PyTorch là một khuôn khổ học máy, dựa trên Python. Nó cung cấp các chức năng cấp cao như xây dựng mô hình học máy từ các khối được định cấu hình sẵn, tải dữ liệu từ các tệp có định dạng khác nhau, thực hiện đào tạo mô hình chỉ với một vài dòng và hơn thế nữa.
Lưu ý rằng ở đầu mỗi trang hướng dẫn đều có liên kết “Chạy trong Google Colab” để mở hướng dẫn trong Google Colab và cho phép bạn tương tác với mã.
Truy cập:
https://pytorch.org/tutorials/beginner/basics/intro.html
Machine Learning
Mặc dù AI đã phát triển rất nhiều trong những năm gần đây nhưng các nguyên tắc cơ bản của Machine Learning vẫn không thay đổi, vì vậy khóa học từ năm 2018 này vẫn là một nguồn tài nguyên tuyệt vời. Tập trung cụ thể vào các bài giảng từ 1 đến 5 và 11 đến 13.
Truy cập:
https://www.youtube.com/watch?v=jGwO_UgTS7I&list=PLoROMvodv4rMiGQp3WXShtMGgzqpfVfbU
Deep Learning
Deep Learning là điều làm cho AI trở nên khả thi. Khóa học Coursera này của Andrew Ng và các đồng nghiệp sẽ mang đến cho bạn phần giới thiệu tốt nhất về chủ đề này.
Sau khi học sinh đã đạt được một số kỹ năng với PyTorch (xem bên dưới), hãy xem thêm sách giáo khoa tương tác này trên DL: https://d2l.ai/.
Truy cập:
https://www.coursera.org/specializations/deep-learning
Natural Language Processing
Sách giáo khoa "Xử lý ngôn ngữ và lời nói" của Dan Jurafsky và James H. Martin là Kinh thánh về NLP. Tập trung vào Phần 1.
Truy cập:
https://web.stanford.edu/~jurafsky/slp3/
Word Embeddings
Đây là cách triển khai thực tế của thuật toán word2vec mà học sinh đã tìm hiểu ở Chương 6 của sách giáo khoa ở trên. Word Embedding là điều kiện tiên quyết cho bất kỳ hoạt động học máy nào được thực hiện trên văn bản. Hãy sử dụng hướng dẫn này để hiểu rõ hơn về khái niệm Word Embedding cũng như cách sử dụng Pytorch và Google Colab để xây dựng và đào tạo các mô hình máy học.
Truy cập:
Transformer
Kiến trúc mô hình chính được sử dụng trong cả xử lý văn bản và hình ảnh ngày nay là kiến trúc transformer. Nó đã cách mạng hóa lĩnh vực NLP vì nó có khả năng song song hóa cao và theo cách đó có thể tiêu thụ lượng dữ liệu lớn hơn nhiều so với trước đây.
Thư viện Python chính để làm việc với kiến trúc này được gọi là transformer và nhiều mô hình hiện có sử dụng kiến trúc này có thể được tìm thấy trong trung tâm HuggingFace.co.
Truy cập:
Generative Modeling
AI sáng tạo là thứ thực sự thu hút sự chú ý của công chúng và đưa AI vào sản xuất chỉ sau một đêm. Kho lưu trữ này của Andrej Karpathy là một phần giới thiệu thực tế tuyệt vời về hoạt động của các mô hình ngôn ngữ tạo sinh.
Truy cập:
https://github.com/karpathy/minGPT
Computer Vision
Một khóa học về deep learning cho CV từ năm 2015, rất tốt để hiểu được các nguyên tắc cơ bản trong lĩnh vực này.
Truy cập
Recent Developments in CV
Khóa học Deep Learning 1 ở đây bao gồm các khái niệm chính trong nghiên cứu CV gần đây như ResNet, các cuộc tấn công đối kháng (adversarial attacks) và vision transformer.
Truy cập:
https://uvadlc-notebooks.readthedocs.io/en/latest/index.html