AI (video, beeld, geluid, sensoren)

zie ook:

Status Quo invoermethoden AI

De aanvankelijk en eerder door mij genoemde LLM-gebaseerde AI is in principe bedoeld om te chatten. D.w.z. je kon er vragen aan stellen door te typen en dan kreeg je een anttwoord in zinnen op jouw scherm (PC, SmartDevice). Ook kon je er teksten, documenten of URL's invoeren waarmee acties konden worden ondernomen. Rekenen kon het ook al aardig, en de meeste andere dingen die (Google en Bing-)zoekmachines al langer konden met hun ingebouwde AI.

Al vrij snel werd daar door OpenAI een eerste variant DALL-E aan toegevoegd. Hiermee kon je een vraag stellen of een zin ingeven en aan de hand daarvan werd een grafische beeld / foto op jouw scherm gegenereerd.

Inmiddels zijn er weer nieuwe ontwikkelingen waarbij beelden via de camera op jouw SmartDevice kunnen worden ingescand , herkend worden en aan de hand daarvan (in combinatie) mee gechat worden, met de ingevoerde foto als uitgangspunt. Google Gemini kan dit vanaf begin 2024.
Ook is er al AI waar dat met geluid via de microfoon kan worden gedaan. (Shazam -Ontdek overal welke songs je om je heen hoort -) kon dat al langer maar ik weet niet of en welke AI zijn eventueel gebruiken)
Invideo review, text-to-video. AI video maken met tekst prompt. 18 november 2023 Tekst naar video
- https://ai-tools.nl/review-deepbrain-de-beste-ai-video-generator/ 18.08.2023

Over andere sensoren (bijv. lichtsisgnalen sec, geluid, warmte, IR, wifi...) ben ik nog niets vanzelf tegen gekomen in de media; maar daar zal men vast ook flink mee bezig zijn. Er staat ons nog heel veel te verwachten.

Neuralink (Elon Musk)

Status Quo uitvoermethoden AI

Muziek
- Muziekbewerking mbv AI
- AI music generator. Zelf AI muziek maken. StockmusicGPT review 19 februari 2024069
- Lalal.Ai review. Beste tool voor muziekproductie & audio bewerken 18 december 2023
  - Lalal.ai is een state-of-the-art service voor het bewerken van audio, zoals het verwijderen van zang en het scheiden van muziekbronnen voor snelle, gemakkelijke en nauwkeurige extractie van stems. Het verwijdert vocale, instrumentale, drum-, bas-, piano-, elektrische gitaar-, akoestische gitaar- en synthesizersporen zonder kwaliteitsverlies.

CoPilot (Microsoft) vhn Bing AI

Bing create

Chat naar beeld - rechtstreeks via prompt

- Op basis van een tekstprompt genereert onze AI een set afbeeldingen die overeenkomen met die prompt.
- Image Creator is een product waarmee gebruikers AI-installatiekopieën kunnen genereren met DALL·E.
- Ons AI-systeem is 'getraind' in een bibliotheek met onlineafbeeldingen en tekst. Net zoals alle nieuwe en zich ontwikkelende technologie, kunt u verrast worden door de resultaten. Image Creator is mogelijk gemaakt met DALL·E
- Hoe meer u creëert, hoe beter u wordt. Speel dus met uw prompts. Voeg beschrijvende woorden toe. En blijf experimenteren tot u krijgt wat u voor ogen hebt
  - Probeer een illustratiestijl, kunstperiode of materiaal.
  - Tekst ziet er mogelijk niet helemaal goed uit.
  - Gezichten en handen kunnen er vervormd uitzien.
  - De prompt wordt mogelijk door het systeem verkeerd geïnterpreteerd.

Foto herkennen en zoeken

Bing zoekmachine kan dat door het "scan-symbool'in het zoekvenster aan te klikken: kijk naar symbolen hieronder.

Gemini (Google) vhn Bard

Multimodaal

voorheen Bard

Chat naar beeld - rechtstreeks via prompt

in het engels kan hij aan de hand van de prompt, bijv. giraffe, een foto van een giraf toont op het display.
in het nederlands werkt dat (nog?) niet

Foto herkennen en combineren met chat

Rechtstreeks via prompt Gemini
optie: we're bringing the capabilities of Google Lens into Bard. zie Google
- Google Lens is een bestaande app op Android Smartphones; Gebruik je camera of een afbeelding om te zoeken

P.M.

Vision AI Gebruik onze baanbrekende volledig beheerde ontwikkeling omgeving Vertex AI Vision om uw eigen computer te maken visietoepassingen of inzichten ontlenen aan afbeeldingen en video's met vooraf getrainde API's, AutoML of aangepaste Modellen.

ChatGPT (OpenAI)

DALL-2E

Chat naar beeld - niet rechtstreeks via prompt

Op basis van een tekstprompt genereert onze AI een set afbeeldingen die overeenkomen met die prompt.

Grok

X laat Grok-AI-chatbot beelden genereren, ook van bekende mensen (werkt niet in onze regio)

Sora creating video from text

Update 16.08.2024