🧠

Modèle multimodal

Architecture / Modèle

🧠 Architecture / Modèle 🌐 Multimodal Model

Définition

Modèle IA capable de traiter et générer plusieurs types de données simultanément : texte, image, audio, vidéo. Les modèles multimodaux comme GPT-4V, Gemini et Claude 3 représentent la convergence des capacités IA.

En anglais

Multimodal Model — An AI model capable of processing and generating multiple data types simultaneously: text, image, audio, video. Multimodal models like GPT-4V, Gemini, and Claude 3 represent the convergence of AI capabilities.

Termes associés

GAN (Generative Adversarial Network)

🧠

Large Language Model (LLM)

🧠

Réseau de neurones

Explorer le glossaire complet

Découvrez tous les termes de l’intelligence artificielle dans notre glossaire.

Voir le glossaire IA → Explorer les outils IA