Compilation et optimisation statique des communications hôte-accélérateur - Mines Paris Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Compilation et optimisation statique des communications hôte-accélérateur

Résumé

La puissance de calcul disponible dans les machines hybrides à base d'accélérateurs matériels nécessite de réécrire les programmes selon un modèle complexe et réparti : les données traitées doivent être copiées entre mémoire de l'hôte et mémoire de l'accélérateur. Cette contrainte est régulièrement identifiée comme le goulet d'étranglement. Nous proposons une transformation automatique que nous avons implémentée comme une passe de compilation au sein de PIPS/PAR4ALL qui génère statiquement des instructions de copies entre l'hôte et l'accélérateur selon deux stratégies " au plus tôt " et " au plus tard ". De plus les communications inutiles avec l'hôte résultant d'une réutilisation de données entre deux appels de noyaux sont évitées. Alors que les instructions initiant les transferts mémoire sont générées statiquement, un support exécutif associe lorsque nécessaire les tableaux de données de l'hôte à des zones mémoires sur l'accélérateur. Nous présentons les gains obtenus avec des expériences.
Fichier principal
Vignette du fichier
A-451.pdf (113.89 Ko) Télécharger le fichier
A-469.pdf (963.59 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre
Loading...

Dates et versions

hal-00744259 , version 1 (22-10-2012)

Identifiants

  • HAL Id : hal-00744259 , version 1

Citer

Mehdi Amini, Fabien Coelho, François Irigoin, Ronan Keryell. Compilation et optimisation statique des communications hôte-accélérateur. Rencontres francophones du Parallélisme (RenPar'20) Symposium en Architectures nouvelles de machines (SympA'14) et la Conférence Française en Systèmes d'Exploitation (CFSE 8), May 2011, Saint-Malo, France. ⟨hal-00744259⟩
213 Consultations
312 Téléchargements

Partager

Gmail Facebook X LinkedIn More