De aanvankelijk en eerder door mij genoemde LLM-gebaseerde AI is in principe bedoeld om te chatten. D.w.z. je kon er vragen aan stellen door te typen en dan kreeg je een anttwoord in zinnen op jouw scherm (PC, SmartDevice). Ook kon je er teksten, documenten of URL's invoeren waarmee acties konden worden ondernomen. Rekenen kon het ook al aardig, en de meeste andere dingen die (Google en Bing-)zoekmachines al langer konden met hun ingebouwde AI.
Al vrij snel werd daar door OpenAI een eerste variant DALL-E aan toegevoegd. Hiermee kon je een vraag stellen of een zin ingeven en aan de hand daarvan werd een grafische beeld / foto op jouw scherm gegenereerd.
Inmiddels zijn er weer nieuwe ontwikkelingen waarbij beelden via de camera op jouw SmartDevice kunnen worden ingescand , herkend worden en aan de hand daarvan (in combinatie) mee gechat worden, met de ingevoerde foto als uitgangspunt. Google Gemini kan dit vanaf begin 2024.
Ook is er al AI waar dat met geluid via de microfoon kan worden gedaan. (Shazam -Ontdek overal welke songs je om je heen hoort -) kon dat al langer maar ik weet niet of en welke AI zijn eventueel gebruiken)
Invideo review, text-to-video. AI video maken met tekst prompt. 18 november 2023 Tekst naar video
Over andere sensoren (bijv. lichtsisgnalen sec, geluid, warmte, IR, wifi...) ben ik nog niets vanzelf tegen gekomen in de media; maar daar zal men vast ook flink mee bezig zijn. Er staat ons nog heel veel te verwachten.
Neuralink (Elon Musk)
Muziek
AI music generator. Zelf AI muziek maken. StockmusicGPT review 19 februari 2024069
Lalal.Ai review. Beste tool voor muziekproductie & audio bewerken 18 december 2023
Lalal.ai is een state-of-the-art service voor het bewerken van audio, zoals het verwijderen van zang en het scheiden van muziekbronnen voor snelle, gemakkelijke en nauwkeurige extractie van stems. Het verwijdert vocale, instrumentale, drum-, bas-, piano-, elektrische gitaar-, akoestische gitaar- en synthesizersporen zonder kwaliteitsverlies.
Chat naar beeld - rechtstreeks via prompt
Op basis van een tekstprompt genereert onze AI een set afbeeldingen die overeenkomen met die prompt.
Image Creator is een product waarmee gebruikers AI-installatiekopieën kunnen genereren met DALL·E.
Ons AI-systeem is 'getraind' in een bibliotheek met onlineafbeeldingen en tekst. Net zoals alle nieuwe en zich ontwikkelende technologie, kunt u verrast worden door de resultaten. Image Creator is mogelijk gemaakt met DALL·E
Hoe meer u creëert, hoe beter u wordt. Speel dus met uw prompts. Voeg beschrijvende woorden toe. En blijf experimenteren tot u krijgt wat u voor ogen hebt
Probeer een illustratiestijl, kunstperiode of materiaal.
Tekst ziet er mogelijk niet helemaal goed uit.
Gezichten en handen kunnen er vervormd uitzien.
De prompt wordt mogelijk door het systeem verkeerd geïnterpreteerd.
Foto herkennen en zoeken
Bing zoekmachine kan dat door het "scan-symbool'in het zoekvenster aan te klikken: kijk naar symbolen hieronder.
Multimodaal
voorheen Bard
Chat naar beeld - rechtstreeks via prompt
in het engels kan hij aan de hand van de prompt, bijv. giraffe, een foto van een giraf toont op het display.
in het nederlands werkt dat (nog?) niet
Foto herkennen en combineren met chat
Rechtstreeks via prompt Gemini
optie: we're bringing the capabilities of Google Lens into Bard. zie Google
Google Lens is een bestaande app op Android Smartphones; Gebruik je camera of een afbeelding om te zoeken
P.M.
Vision AI Gebruik onze baanbrekende volledig beheerde ontwikkeling omgeving Vertex AI Vision om uw eigen computer te maken visietoepassingen of inzichten ontlenen aan afbeeldingen en video's met vooraf getrainde API's, AutoML of aangepaste Modellen.
Chat naar beeld - niet rechtstreeks via prompt
Op basis van een tekstprompt genereert onze AI een set afbeeldingen die overeenkomen met die prompt.
Grok
X laat Grok-AI-chatbot beelden genereren, ook van bekende mensen (werkt niet in onze regio)
Update 16.08.2024