Apakah Cloud AutoML Vision Bisa Digunakan oleh Non-programmer?

Pada September 2018 lalu “Cloud AutoML Vision” BETA telah dirilis di sebuah event Google Cloud Next ‘18 yang diselenggarakan di San Fransisco.

Cloud AutoML Vision merupakan suatu layanan yang membuat suatu model pengenalan gambar yang unik tanpa perlu pengetahuan yang tinggi tentang machine learning.

Apakah modelnya bisa dibuat tanpa perlu pengetahuan yang mendalam mengenai machine learning, kali ini kami (yang sama sekali tidak menguasai programming) mencoba membuat model yang menggunakan Cloud AutoML Vision.

1. AutoML Vision: Sebuah Layanan yang Mampu Membuat Model Pengenalan Gambar Asli dengan Mudah

Layanan yang disebut "Vision API" telah disediakan sebagai layanan pengenalan gambar Google Cloud. Vision API adalah layanan yang dapat dengan mudah menggunakan teknologi pengenalan gambar dan dapat mendeteksi (melabeli) informasi dari gambar, mendeteksi konten yang tidak pantas, dan mendeteksi teks. AutoML Vision juga merupakan layanan pengenalan gambar, tetapi tidak seperti Vision API, ini adalah layanan yang dapat "mempelajari gambar unik dan membuat dan menggunakan model pengenalan gambar yang unik".

Vision API menggunakan model pengenalan gambar yang sudah Google “pelajari sebelumnya”, jadi dia bisa dengan mudah menggunakan teknologi pengenalan gambar seperti melabeli dengan biaya yang rendah. Namun ada banyak juga kasus dimana tidak semua bisa melakukannya. Misalnya, saya memiliki anjing yang bernama “Ponta” dari Yorkshire Terrier. Saat memuat gambarnya ke Vision API, secara otomatis akan dilabeli dengan “Yorkshire Terrier” bukannya “Ponta” karena Google belum mempelajarinya. Jadi masih belum memungkinkan untuk membedakan anjing “Ponta” saya dengan Yorkshire Terrier yang lainnya.

Akan tetapi, di AutoML Vision, Anda bisa membuat model pengenalan gambar yang juga bisa melabeli “Ponta” dengan menyiapkan dan melabeli gambar sendiri dan mempelajarinya. Sebagai tambahan, pemahaman tentang machine learning tidak diperlukan untuk menjalankan pembelajaran ini, jadi layanan ini merupakan layanan yang sangat bagus.

Kali ini kami akan mencoba membuat model yang akan membedakan dan melabeli anjing “Yorkshire Terrier” yang lain dengan menggunakan Cloud AutoML Vision.

2. Membuat Model Menggunakan AutoML Vision

1）Mempersiapkan Gambar untuk Latihan

Sebelum belajar dengan AutoML Vision, perlu untuk mempersiapkan gambar pembelajaran. Sekarang, kami akan membuat model yang bisa diklasifikasikan ke dalam kategori “Ponta” dan “Lain-lain”, jadi kami mengumpulkan gambar sebagai data pembelajaran. Gambar “Ponta” diambil dari gambar mereka sendiri, sedangkan gambar “Yorkshire Terrier yang lain” meminjam dari (http://vision.stanford.edu/aditya86/ImageNetDogs/). Ketika Anda melakukannya sendiri, jika Anda menelusuri di Google dengan kata kunci “data set (gambar yang dikehendaki)”, maka akan muncul sebagai data set, kecuali apabila dianggap sebagai maniac.

2) Persiapan Untuk Menggunakan AutoML Vision

Setelah melakukan persiapan gambar yang digunakan sebagai data set training, sekarang waktunya untuk mempersiapkan AutoML Vision. (Berdasarkan asumsi bahwa pembuatan akun Google, pengaturan billing GCP, dan juga project creation sudah selesai).

Pertama-tama, silakan akses (https://beta-dot-custom-vision.appspot.com/vision/?project=（プロジェクト名）, setelah itu akan muncul laman seperti di bawah ini.

Setelah selesai dengan pengaturan billing GCP, Anda bisa lewati ke “1. Enable billing”. Klik "SET UP NOW" di "2. Enable the required APIs and service accounts" untuk mengaktifkan aktivasi API, membuat akun layanan, dan membuat bucket GCS untuk penyimpanan gambar.

Selanjutnya, berlanjut ke pembuatan data set. Data set merupakan suatu unit pembuatan model. Silakan klik “NEW DATASET” di bagian atas layar. Kemudian akan muncul seperti layar di bawah ini, kemudian input informasi yang diperlukan.

Dataset name ：Silakan input nama apapun

Import Image ：Pilih “Import images later”

Classification Type ：Black

Begitu selesai menginput data-data tersebut di atas, klik CREATE DATASET maka data set akan segera dibuat. Dengan ini persiapan untuk environment pembelajaran model sudah selesai.

3) Mengunggah Gambar Model Pembelajaran

Selanjutnya, kami akan mengunggah gambar yang digunakan untuk pembelajaran. Di bagian atas di layar sebelumnya, klik +ADD IMAGES, kali ini klik “Upload from your computer” untuk mengunggah gambar pembelajaran dari komputer lokal Anda.

Pilih file kemudian unggah gambar.

Dengan ini, proses pengunggahan gambar pembelajaran sudah selesai.

4) Pembuatan Label dan Pelabelan Gambar Pembelajaran

Jika sudah selesai mengunggah gambar untuk training, maka selanjutnya adalah melabeli setiap gambar. AutoML akan mempelajari gambar-gambar yang sudah dilabeli dan juga akan membangun model.

Klik ADD LABEL di sebelah kiri gambar di atas.

Proses pelabelan selesai saat Anda berhasil memberi label nama dengan kata apapun (kali ini kami melabeli dengan label “ponta”). Selanjutnya akan kami lanjutkan dengan pelabelan gambar.

Pilih gambar mana yang akan dilabeli, lalu klik “Label” di bagian atas layar. Jika gambar yang sudah dilabeli dipilih, maka proses pelabelan sudah selesai. Kali ini, kami akan membuat model yang akan diklasifikasikan ke dalam dua kategori: "Ponta" dan "Yorkshire Terrier lain", jadi kami membuat label untuk "Other" dan menampilkan 3) dan 4) untuk Yorkshire Terrier lainnya.

Sampai disini, persiapan untuk training sudah selesai.

5）Pengeksekusian Training

Selanjutnya, kita akan belajar cara membuat model dengan Auto ML berdasarkan gambar yang sudah dilabeli. Klik TRAIN di bagian atas layar sebelumnya.

Setelah itu, layar akan bertransisi menjadi tampilan seperti di atas, kemudian klik “START TRAINING” .

Selanjutnya, atur nama model dan klik START TRAINING untuk memulai training. Karena hanya ada 100 gambar untuk belajar kali ini, training selesai dalam waktu sekitar 6 menit, dan pembuatan model pun selesai.

6) Verifikasi Keakuratan

Berikutnya, kita akan memverifikasi tingkat keakuratan dari model yang sudah dibuat sebelumnya.

Klik “PREDICT” di bagian atas layar.

Klik UPLOAD IMAGES dan unggahlah gambar yang Anda inginkan untuk selanjutnya dibedakan oleh model. Saat memverifikasi, silakan gunakan gambar yang disiapkan terpisah dari gambar yang digunakan untuk belajar.

Begitu diunggah, hasil verifikasinya adalah sebagai berikut. Hasilnya akan keluar seperti gambar “ponta 0.820” di atas. Ini maksudnya adalah model mengenali gambar ini sebagai ponta dengan tingkat keakuratan 82%.

Kali ini, karena jumlah gambar terlalu sedikit, 50 ponta / 50 lainnya, sehingga tingkat akurasi ini tercapai. Namun, akurasi dapat ditingkatkan dengan meningkatkan jumlah gambar untuk training.

Hasil dari gambar yang berjumlah total 300 lembar itu adalah sebagai berikut:

・Hasil pembacaan gambar ponta

1-①

1-②

1-③

・Hasil pembacaan gambar “selain” ponta.

2-①

2-②

2-③

Bahkan jika pop-up terlalu kecil seperti (1-②), sangat mungkin untuk membedakan dengan akurasi tinggi. Akan tetapi, tingkat kepercayaan pada gambar kecil (1-③) menjadi berkurang.

Di “other”, kami memilih foto yang terlihat mirip dengan Ponta dan memverifikasinya. Dalam 2-①, kami mencoba memilih dan memverifikasi fitur dengan fitur serupa, tetapi kami dapat mengenalinya dengan akurasi tinggi. Dalam 2-②, kami memilih wajah yang tidak tampak bagus, tetapi ini juga dikenali dengan akurasi tinggi.

3. Kesimpulan

Apabila menggunakan AutoML Vision seperti ini, kami yang tidak mempunyai pengetahuan dasar tentang machine learning ataupun tidak bisa programming, bahkan orang yang tidak bisa teknis pun mampu membuat model pengenalan gambar sendiri dengan mudah.