Cours 13 | Déploiement de l’algorithme L sur GPU

Titre: Déploiement de l’algorithme L sur GPU

Auteurs: Pierre Fortin, Mourad Gouicem, Stef Graillat

Ecole: LIP6, UPMC

Résumé:

  • Architecture many-core
  • Exécution partiellement SIMD
  • 14 Stream Multiprocessor (SM) sur Fermi (C2050)
  • Chaque SM possède 32 CUDA cores soit 14 × 32 = 448 CUDA Cores sur le C2050
  • Registres de 32-bit (32 768 par SM)

Extrait du sommaire:

1 Présentation des GPU
2 Architecture et programmation CUDA
3 Arithmétique sur Fermi (C2050)
4 L’algorithme L
5 Présentation de l’algorithme
6 Déploiement sur GPU
7 Perspectives

Formation-GPU-CUDA-cours 13

Obtenir le fichier PDF: Déploiement de l’algorithme L sur GPU