Ok parliamo ora degli assistenti virtuali, sicuramente partiamo con gli assistenti vocali, cioè quelli che si basano sul riconoscimento della voce.
Strumenti come Dragon Naturally Speaking permettono attraverso il riconoscimento vocale dell'utente sia di dettare testi al PC, che di controllare le funzioni del del computer, come le funzioni del mouse, lanciare applicativi, selezionare i menù, eseguire i comandi impartiti attraverso la voce.
Anche altri assistenti vocali come Siri, Cortana, Alexa di Amazon e Google Home si attivano tramite la voce, quindi ci vuole un comando vocale, di solito: "Ehi Siri", "Ok Google" e questi assistenti interagiscono con la persona che li attiva.
L'utente può richiedere informazioni su determinati argomenti, che vengono di solito recuperate da Wikipedia o comunque da altri siti citati dallo strumento.
Si può chiedere di riprodurre delle canzoni, di impostare una sveglia, eventualmente acquistare un prodotto, per esempio con Alexa di Amazon, e quindi se si imposta il collegamento alle all'account dell'utente, si può anche accedere all'agenda, impostare un evento, contattare persone per telefonare o inviare un messaggio e condividere la propria posizione e chiedere per esempio se intorno ci siano ristoranti aperti in quel momento, pizzerie da asporto...
I programmatori fanno uno sforzo per farli sembrare più umani e fanno rispondere con espressioni molto naturali, anche con interiezioni come esitazioni, per rendere appunto l'interazione con questi assistenti vocali estremamente credibile, naturale.
Esistono anche dei Chatbot multimodali, abbiamo visto la versione 3 di Chat GPT che ci permette di interagire principalmente tramite comandi testuali, ma i Chatbot multimodali, ci permettono di interagire con diverse modalità, quindi non solo con il testo, ma anche con la voce, con immagini.o anche video.
Oltre a Chat GPT-4 segnalo anche Gemini recentissimamente rilasciato, a febbraio 2024, sviluppato da Google.
Che comprende e risponde ad input non solo testuali, ma anche audio, immagini, video.
C'è un interessante video su YouTube che dimostra appunto l'interazione con Gemini.
Per completare il panorama ci sono anche strumenti di intelligenza artificiale che offrono degli Avatar interattivi.
Con Avatar si intende una sorta di assistente che ha sembianze umane.
Esistono, per esempio, soluzioni come Algo, che offre un avatar con sembianze umane e basato su intelligenza artificiale conversazionale.
Addestrato per interagire attraverso la lingua dei segni anche in italiano, è un progetto italiano.
Algo può interagire con l'utente, che si posiziona davanti al monitor o al display dello smartphone, e permette l'interazione attraverso la lingua dei segni.
Un'altra app interessante che segnalo si chiama Hand Talk, di nuovo si tratta di un Avatar, un personaggio da cartone animato, che permette di interpretare attraverso la lingua dei segni le pagine web.
Cioè, si seleziona del testo da una pagina web e si attiva Hand Talk, che interpreta attraverso la lingua dei segni il contenuto.
Purtroppo non è ancora disponibile italiano, ma solo in inglese e in portoghese.