Speech Recognition

Github
https://github.com/NVIDIA/NeMo

NVIDIA NeMo

NVIDIA NeMo is a conversational AI toolkit built for researchers working on automatic speech recognition (ASR), natural language processing (NLP), and text-to-speech synthesis (TTS). The primary objective of NeMo is to help researchers from industry and academia to reuse prior work (code and pretrained models) and make it easier to create new conversational AI models.

Pre-trained NeMo models.

Introductory video.

Simple audio recognition: Recognizing keywords
https://www.tensorflow.org/tutorials/audio/simple_audio

Run in Colab: https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/audio/simple_audio.ipynb

Speech Recognition

Githubhttps://github.com/NVIDIA/NeMo

NVIDIA NeMo

Github
https://github.com/NVIDIA/NeMo