d’unités de texturing par SM est doublé et passe à 8. Le ratio d’unités de texturing par unité de calcul augmente ainsi de 1 pour 8 à 1 pour 6, ce qui est particulièrement intéressant pour bon nombre de jeux. Enfin, les unités de calcul sont simplifiées pour laisser tomber le support performant de la double précision. Globalement, Nvidia a donc revu son architecture pour la rendre plus efficace dans les jeux, en faisant quelques compromis au niveau du GPU computing, ce qui permet de
proposer des produits plus intéressants pour bon nombre d’utilisateurs. Les GeForce GTX 460 avec le GF104 ont introduit cette évolution qui est maintenant partagée par la GeForce GTS 450 et son GF106. Ce dernier est grossièrement un demiGF104 et contient donc 192 unités de calcul contre 384 pour le premier. Il dispose par contre d’un bus mémoire de 192 bits contre 256bits pour le GF104.
Notez que certaines de ces unités sont cependant désactivées dans les produits commercialisés. Ainsi un SM est désactivé dans les GeForce GTX 460 qui se contentent de 336 unités de calcul et le bus mémoire est réduit sur la version 768 Mo de cette carte. Pour la GeForce GTS 450, Nvidia a également décidé de limiter le bus mémoire, à 128 bits pour pouvoir commercialiser une carte 1 Go. Une version 192 bits (768 Mo ou 1.5 Go) est cependant disponible pour les fabricants de PCs.
La carte de référence
Architecture Fermi : structure GTX 460 1 Go
GTX 460 768 Mo
GTS 450
HD 5830
HD 5770
HD 5750
Puce
GF104
GF104
GF106
Cypress LE
Juniper
Juniper
Technologie
40 nm
40 nm
40 nm
40 nm
40 nm
40 nm
Fréquence GPU (MHz)
675
675
783
800
850
700
Fréquence du shader core (MHz)
1350
1350
1566
800
850
700
Processeurs
336
336
192
224x5
160 x 5
144 x 5
Unités de texturing
56
56
32
56
40
36
ROPs
32
24
16
16
16
16
Mémoire (Mo)
1024
768
1024
1024
1024
1024
Bus mémoire (bits)
256
192
128
256
128
128
Fréquence DDR (MHz)
1800
1800
1804
2000
2400
2300
Puissance de calcul (Gflops)
907
907
601
1792
1360
1008
Puissance de texturing (Gtexels/s)
38
38
25.1
45
34
25
Fillrate (GPixels/s)
9
9
6
13
14
11
BP mémoire (Go/s)
107
81
54
119
72
69
Direct3D
11
11
11
11
11
11
Prix
230 €
200 €
130
170 €
130 €
120 €
La GeForce GTS 450 de référence reprend un design en apparence très proche de celui de la GeForce GTX 460. Son système de refroidissement à cependant été simplifié de manière à s’adapter à ce plus petit GPU. Tout comme sur les modèles concurrents, il occupe deux slots, ce qui semble malheureusement être devenu la norme. Comme toutes les GeForce 400 de référence, elle propose 2 sorties DVI Dual-Link et une sortie miniHDMI 1.4 qui permet un support complet des écrans 3D et du bitstream audio des formats avancés, ce dernier venant d’être activé avec les pilotes 260.xx. Un seul connecteur d’alimentation PCI Express 6 broches est requis et la carte est compatible avec le SLI.
Les derniers GPUs Nvidia reposent sur des blocs principaux appelés GPCs (Graphic Processing Clusters) qui peuvent être vus comme de véritables petits GPUs à l’intérieur du GPU. Chaque GPC dispose ainsi d’un rasterizer pour découper les triangles en pixels et d’un certains nombre de blocs d’exécution, les SMs (Streaming Multiprocessor), chargé d’exécuter pixel, vertex, et autres shaders. Pour cela les SMs contiennent des unités de calcul et de texturing. Pour alimenter les GPCs, les GPUs Fermi reposent sur des contrôleurs mémoire de 64 bits, chacun équipés d’un certain nombre de ROPs, chargés d’écrire les pixels en mémoire. Voici la composition des GPUs qui sont déjà disponibles : GF100 : 4 GPCs x 4 SMs x (32 unités de calcul + 4 unités de texturing) + 6 contrôleurs mémoire x 8 ROPs GF104 : 2 GPCs x 4 SMs x (48 unités de calcul + 8 unités de texturing) + 4 contrôleurs mémoire x 8 ROPs GF106 : 1 GPC x 4 SMs x (48 unités de calcul + 8 unités de texturing) + 3 contrôleurs mémoire x 8 ROPs
Schéma de l’organisation du GF106.
Hardware Magazine
I 21