TA212201005

MazeNav

Q-Learning adalah salah satu algorima Machile Learning yang umum digunakan. Untuk mendukung penggunaan Q-Learning, peneliti mendesain akselerator hardware untuk mempercepat proses learning pada Q-Learning. Pada kasus maze navigation, diperlukan suatu platform uji untuk memastikan kualitas dari akselerator Q-Learning. Parameter kualitas yang diuji berupa akurasi dari akselerator, efektivitas jalur yang ditemukan, dan kemampuan akselerator beradaptasi pada lingkungan yang berubah pada tingkat tertentu. Oleh karena itu dibuatlah MazeNav sebagai platform pengujian tersebut.

MazeNav adalah platform pengujian untuk QLA yang merupakan set berupa robot dan arena untuk pengujian. MazeNav akan terhubung ke hardware accelerator dengan protokol komunkasi umum seperti UART dan Jupyter Notebook untuk menguji kemampuan hardware accelerator. Robot pengujian pada MazeNav akan menelusuri maze pada arena sesuai dengan petunjuk hardware accelerator. Pada maze terdapat fitur lokalisasi RFID dan obstacle untuk menambah fleksibilitas pengujian. MazeNav dapat mendukung board untuk berkomunikasi secara wireless dengan penguji. Robot pada MazeNav bergerak berdasarkan grid tertentu dengan line guidance. Penggunaan Mazenav ditujukan untuk akurasi dan fleksibilitas pengujian dari hardware accelerator untuk Q learning untuk maze navigation problem.