Modèle multimodal
Architecture / Modèle
Définition
Modèle IA capable de traiter et générer plusieurs types de données simultanément : texte, image, audio, vidéo. Les modèles multimodaux comme GPT-4V, Gemini et Claude 3 représentent la convergence des capacités IA.
En anglais
Multimodal Model — An AI model capable of processing and generating multiple data types simultaneously: text, image, audio, video. Multimodal models like GPT-4V, Gemini, and Claude 3 represent the convergence of AI capabilities.
Termes associés
Auto-encodeur
Modèle de diffusion
Modèle de fondation
GAN (Generative Adversarial Network)
Large Language Model (LLM)
Réseau de neurones
Explorer le glossaire complet
Découvrez tous les termes de l’intelligence artificielle dans notre glossaire.