Titre: Déploiement de l’algorithme L sur GPU
Auteurs: Pierre Fortin, Mourad Gouicem, Stef Graillat
Ecole: LIP6, UPMC
Résumé:
- Architecture many-core
- Exécution partiellement SIMD
- 14 Stream Multiprocessor (SM) sur Fermi (C2050)
- Chaque SM possède 32 CUDA cores soit 14 × 32 = 448 CUDA Cores sur le C2050
- Registres de 32-bit (32 768 par SM)
Extrait du sommaire:
1 Présentation des GPU
2 Architecture et programmation CUDA
3 Arithmétique sur Fermi (C2050)
4 L’algorithme L
5 Présentation de l’algorithme
6 Déploiement sur GPU
7 Perspectives
Obtenir le fichier PDF: Déploiement de l’algorithme L sur GPU