Intel lance de nouveaux GPU et accélérateurs d'IA pour les stations de travail IA
Author:admin Date: 2025-05-28 07:09 Views:750
Au Computex Taipei 2025, Intel Intel a lancé deux nouveaux produits matériels axés sur l'IA : les GPU Arc™ Pro série B pour les applications créatives et de pointe, et l'accélérateur d'IA Gaudi de troisième génération pour l'entraînement de modèles à grande échelle. Parallèlement, Intel a modernisé sa chaîne de développement afin d'optimiser la synergie matériel-logiciel et de renforcer son écosystème d'IA.
Nouveaux GPU Intel Arc Pro série B : conçus pour l'IA Edge et le travail créatif
Les processeurs graphiques Intel Arc Pro B60 et B50 reposent sur l'architecture Xe de deuxième génération (Xe2) et intègrent des moteurs d'IA XMX (Xe Matrix eXtensions). Optimisés pour les charges de travail professionnelles telles que la conception architecturale, la modélisation technique, la création graphique et l'inférence d'IA, ces GPU offrent des performances élevées et une efficacité énergétique optimale pour les appareils edge et les stations de travail créatives.
Arc Pro B60 (modèle phare)
Doté de 20 cœurs Xe et de 160 moteurs d'IA XMX
Mémoire GDDR6 de 24 Go, bus 192 bits, jusqu'à 456 Go/s de bande passante
Jusqu'à 197 TOPS de performances d'inférence avec une précision INT8
Plage de TDP de 120 W à 200 W, prenant en charge les configurations multi-GPU
Certifié pour les applications ISV courantes telles que SolidWorks, Maya et Blender
Arc Pro B50 (version économe en énergie)
Équipé de 16 cœurs Xe et de 128 moteurs XMX
Mémoire GDDR6 de 16 Go, bus 128 bits, bande passante jusqu'à 224 Go/s
Performances d'inférence jusqu'à 170 TOPS avec une précision INT8
Seulement 70 W TDP, idéal pour les postes de travail à petit facteur de forme ou les tâches d'IA légères telles que l'amélioration d'image et l'accélération CAO
Les deux GPU prennent en charge les piles de pilotes professionnels et grand public sur les plates-formes Windows et sont entièrement compatibles avec les logiciels certifiés ISV, permettant une intégration transparente de l'IA dans les postes de travail locaux.
Accélérateurs d'IA Intel Gaudi 3 : Optimiser la formation à l'IA en entreprise
Conçu pour la formation de modèles de grande taille et l'inférence à haute efficacité, l'accélérateur d'IA Gaudi de troisième génération d'Intel, Gaudi 3, apporte des améliorations significatives en termes de calcul, de mémoire et de réseau, en concurrence directe avec le H100 de NVIDIA.
Spécifications matérielles
Procédé TSMC 5 nm, architecture à double matrice
8 moteurs de multiplication de matrices (MME) et 64 cœurs de traitement de tenseurs (TPC)
Mémoire HBM2e de 128 Go avec une bande passante de 3,7 To/s
Prend en charge les formats FP8 et BF16 avec des performances de pointe allant jusqu'à 1,8 PFLOP
Avantages en termes de performances
2× les MME, 1,5× la bande passante mémoire et 40% d'efficacité énergétique supérieure par rapport à Gaudi 2
Intel revendique une formation LLM 1,7 fois plus rapide et une inférence 2,3 fois plus efficace que NVIDIA H100 (sur la base des benchmarks Llama2-13B)
Architecture de mise en réseau et d'évolutivité
24 ports Ethernet 200 GbE intégrés avec RDMA par puce
Prend en charge la topologie All2All avec une bande passante inter-nœuds jusqu'à 150 Go/s
S'adapte à 512 nœuds à l'aide de normes Ethernet ouvertes, éliminant ainsi le besoin de commutation propriétaire.
Support logiciel : Habana Synapse AI SDK
Le SDK Habana Synapse AI fournit une prise en charge native de PyTorch, TensorFlow et ONNX, permettant des flux de travail de formation optimisés et une planification flexible de la charge de travail sur les moteurs MME et TPC.
Prend en charge le déploiement PCIe et à l'échelle du rack
Intel Gaudi 3 propose deux formats de déploiement pour répondre aux besoins de calcul de l'IA à différentes échelles :
Carte accélératrice PCIe Gaudi 3Conçu pour les serveurs de centres de données grand public, il offre une flexibilité d'extension et est idéal pour les PME et les équipes de R&D souhaitant exécuter des charges de travail d'inférence sur des modèles tels que Llama 3.1 8B à Llama 4 Maverick. Disponible au second semestre 2025.
Système à rack Gaudi 3Prend en charge jusqu'à 64 accélérateurs par rack, offrant un total de 8,2 To de mémoire à large bande passante. Conçu avec une conception ouverte et modulaire et un refroidissement liquide, il est compatible avec les normes Open Compute Project (OCP), permettant aux CSP et aux grandes entreprises de créer une infrastructure évolutive à faible latence pour la formation et l'inférence à grande échelle.
Cette stratégie de déploiement à double format reflète la vision d'Intel de construire une infrastructure d'IA « ouverte, flexible et sécurisée », prenant en charge une extension fluide d'une seule machine à un grand cluster.
Intel AI Assistant Builder : version open source
Parallèlement au lancement du matériel, Intel a officiellement ouvert le code source de son outil AI Assistant Builder. Ce framework permet aux développeurs d'exécuter des agents d'IA légers localement sur les plateformes Intel, avec prise en charge du déploiement conteneurisé sous Linux et Windows.
La pile logicielle d'Intel continue d'évoluer pour tirer parti de l'architecture MME et TPC, permettant une planification au niveau des tâches et un traitement efficace des charges mixtes pour les développeurs qui créent des solutions d'IA de pointe ou d'entreprise.
Cette initiative open source s’inscrit dans l’engagement d’Intel à fournir aux développeurs des outils d’IA accessibles, efficaces et flexibles.
Intel remet en question le statu quo en matière de calcul d'IA
Alors que NVIDIA continue de dominer l'accélération de l'IA, les GPU Arc Pro d'Intel et les accélérateurs d'IA Gaudi 3 offrent une alternative convaincante, axée sur des normes ouvertes, une infrastructure évolutive et des performances économes en énergie.
Arc Pro et Gaudi 3 devraient être disponibles dans le commerce au cours du second semestre 2025, propulsant la prochaine génération de performances d'IA sur les postes de travail, les centres de données et les infrastructures d'entreprise.