Catégorie : Informatique

Informatique

Top500 : Le supercalculateur Summit d’IBM toujours en tête

En novembre 2019, le nombre de supercalculateurs installés en Chine a retrouvé son niveau de l’année dernière avec 227 unités contre 118 pour les Etats-Unis. Cela n’empêche pas ces derniers de garder la tête du classement avec les systèmes Summit et Sierra, challengés par la Chine et ses Sunway TaihuLight et Tianehe-2A.

Pour cette 54e édition du classement Top500 des plus puissants supercalculateurs mondiaux, peu de changements significatifs à signaler pour le cru de novembre 2019. En tête du palmarès, on retrouve ainsi les systèmes Summit du Laboratoire national Oak Ridge et Sierra du Lawrence Livermore National Laboratory avec des puissances respectives de 148,6 pétaflops et 94,64 pétaflops. Ces derniers sont talonnés par les supercalculateurs chinois Sunway TaihuLight (National Supercomputing Center à Wuxi) et Tianehe-2A (National Supercomputing Center à Guangzhou) qui atteignent pour le premier 93,01 petaflops et 61,44 pétaflops pour le second. Le premier système français reste toujours à la porte du Top10, il s’agit du Pangea III de Total et ses 14,86 pétaflops (11e place).

En termes d’installations, la Chine arrive en tête avec 227 unités contre 118 pour les Etats-Unis, mais on notera qu’en termes de performance cumulée, les US sont devant (37,8% versus 31,9%) bien que cette avance s’est réduite depuis juin (38,4% versus 29,9%). D’un point de vue plateforme, 174 supercalculateurs s’appuient sur des systèmes Lenovo, 71 sur Sungon et 65 sur Inspur. Si on totalise les systèmes sous Cray (36) et HPE (35) qui sont désormais réunis depuis le rachat, le couple américain est 2e ex aequo derrière le fournisseur chinois. « Au niveau processeur, Intel continue sa domination. Ses puces sont présentes dans 470 des 500 systèmes répartis entre plusieurs générations de matériels Xeon et Xeon Phi. IBM est le deuxième avec 14 systèmes – 10 avec des processeurs Power et quatre avec des puces Blue Gene / PowerPC. AMD ne revendique que trois systèmes dans la liste actuelle », peut-on lire dans un communiqué.

IBM bien placé au classement des supercalculateurs

En parallèle du Top500, un autre classement poursuit son bonhomme de chemin, le Green500. Créé en novembre 2007, ce dernier liste les systèmes les plus efficients d’un point de vue énergétique. En premier, on trouve le prototype japonais A64FX (Fujitsu) qui délivre une puissance de 16,9 gigaflops/watt, suivi par un autre japonais le NA-1 (16,3 gigaflops/watt), système de calcul Pezy pour la recherche. En 3e position on trouve l’IBM AiMOS du Rensselaer Polytechnic Institute Center for Computational Innovations (CCI), (15,8 gigaflops/watt), Satori (IBM / MIT) de 15,6 gigaflops et Summit (14,7 gigaflops/watt). « Les 10 principaux systèmes Green500 restants de la liste – AI Bridging Cloud Infrastructure , MareNostrum P9 CTE, Tsubame 3.0, Pangea III et Sierra – utilisent également des accélérateurs GPU Nvidia », indique un communiqué.

 

 

 

 

 

Informatique

L’Intelligence Artificielle au centre de la solution de Criteo

Criteo, la plateforme publicitaire pour l’Internet ouvert, révolutionne, grâce à l’Intelligence artificielle (IA), l’interaction entre les consommateurs et les marques. Afin de tirer profit de toutes les possibilités offertes par l’IA, l’entreprise s’appuie sur les avantages que présentent les architectures d’Intel.

 

Criteo, start-up créée en France en 2005 par JB Rudelle, est reconnue aujourd’hui comme un leader mondial de la publicité en ligne personnalisée. Criteo offre à ses clients des annonces efficaces sur tous les canaux, en appliquant une technologie de Machine Learning avancée, liée à des ensembles de données inégalés. Grâce à son centre de Recherche et Développement (R&D), l’entreprise fournit à ses clients une plateforme publicitaire intelligente capable de cibler efficacement les consommateurs sur tous les canaux, répondant avec précision et rapidité à leurs besoins.

Pour ce faire, Criteo s’appuie sans mesure sur l’IA depuis 15 ans en appliquant une technologie de Machine Learning avancée, liée à des ensembles de données inégalés. ; Au sein de l’entreprise, prêt de 700 collaborateurs (sur 2900 au total) travaillent au sein du pôle de recherche et développement. « En 2018, nous avons créé un laboratoire, le Criteo AI Lab, qui compte une centaine de chercheurs et d’ingénieurs dont l’objectif est de repousser les limites de nos connaissances en IA, les tester à grande échelle et les mettre en production », indique Romain Lerallut, VP à la tête du Criteo AI Lab.

Au quotidien, les algorithmes de Machine Learning et Deep Learning construisent des modèles de prédiction et de recommandation capables de proposer la recommandation la plus appropriée : il s’agit d’afficher la publicité dont l’internaute aura besoin, au bon moment, sur le bon canal, afin de convertir la publicité en vente, transformer l’internaute en consommateur. Pour y parvenir, Criteo s’appuie sur son infrastructure, l’un des plus gros clusters Hadoop en Europe (4000 nœuds, 300 Po, 5 pétaflops) capable de trier, vérifier et analyser un conséquent volume de données. « Le travail sur les données représente 30 à 50 % du temps du projet afin de les rendre disponibles pour l’apprentissage et la prédiction », indique Romain Lerallut. Dans son infrastructure, Criteo exploite à la fois des processeurs graphiques, notamment pour le traitement des images, mais aussi, et même majoritairement, des CPUs (processeurs Intel® Xeon® Scalable) pour la préparation des données, l’inférence, et une grande partie du training.

 

« Les CPUs offrent à la fois des performances de calcul et de faibles consommations, notamment pour certains types de modèles comme la régression logistique ou les arbres de décision. N’oublions pas que nous sommes soumis dans nos datacenters à des contraintes énergétiques très fortes », concède Romain Lerallut. L’entreprise travaille ainsi massivement avec des technologies open source (Hadoop, TensorFlow, CouchBase, etc.), contribue à leur évolution et partage ses recherches lors de grandes conférences internationales telles que ICML (International Conference on Machine Learning). Pour Criteo, l’infrastructure, matérielle et logicielle, joue un rôle majeur dans l’intelligence artificielle.

Des temps de réponse toujours plus bas

L’enjeux est de taille : être capable d’apporter une réponse pertinente en un temps record, dans le contexte d’un volume de données croissant : le temps de réponse devra être de l’ordre de la milliseconde en supportant des modèles d’apprentissage plus larges et plus profonds. Que ce soit en apprentissage ou en prédiction, l’accès aux données peut être un goulot d’étranglement et il faut raisonner au niveau du système en entier. « En quelque sorte, Criteo dispose d’un moteur massif qu’il faut alimenter avec de gros tuyaux pour exploiter tout le carburant », compare Romain Lerallut.

Intel, en tant que partenaire technologique, Intel accompagne Criteo dans son ambition de rendre l’IA toujours plus efficace, performante, et économique. Ainsi, Intel insère les CPU Intel® Xeon® Scalable au sein des serveurs existants (calculs d’inférence et de training) et continuera à performer en proposant à l’avenir des architectures dédiées au Deep Learning haute performance via des cartes Intel® Nervana™ NNP-I/T. L’architecture d’Intel, agnostique en termes de couches logicielles, supporte les solutions et les frameworks Open Source. Depuis ces architectures largement optimisées pour exécuter les calculs d’IA, Intel propose son expertise R&D à Criteo pour ses tests et phases exploratoires.