Aller au contenu principal
🧠

Modèle multimodal

Architecture / Modèle

🧠 Architecture / Modèle 🌐 Multimodal Model

Définition

Modèle IA capable de traiter et générer plusieurs types de données simultanément : texte, image, audio, vidéo. Les modèles multimodaux comme GPT-4V, Gemini et Claude 3 représentent la convergence des capacités IA.

En anglais

Multimodal Model — An AI model capable of processing and generating multiple data types simultaneously: text, image, audio, video. Multimodal models like GPT-4V, Gemini, and Claude 3 represent the convergence of AI capabilities.

Termes associés

🧠
Auto-encodeur
🧠
Modèle de diffusion
🧠
Modèle de fondation
🧠
GAN (Generative Adversarial Network)
🧠
Large Language Model (LLM)
🧠
Réseau de neurones

Explorer le glossaire complet

Découvrez tous les termes de l’intelligence artificielle dans notre glossaire.