Servindo como a introdução do Fermi, a série GeForce 400 é uma série de unidades de processamento gráfico desenvolvidas pela Nvidia. Seu lançamento foi originalmente programado para novembro de 2009;[2] no entanto, após atrasos, foi lançado em 26 de março de 2010, com disponibilidade em abril de 2010.

NVIDIA GeForce 400
Codinome GF10x
Lançado em 12 de abril de 2010
GPU básica GeForce GT 420, GT 430
GPU Intermediária GeForce GT440, GTS 450, GTX460, GTX465
GPU Topo-de-linha GeForce GTX 470, GTX 480
Versão DirectX Direct3D 12.0 (nível de recurso 11_0)[1]
Shader Model 5.1

Seu concorrente direto era o Radeon HD 5000 Series da ATI.

As placas gráficas Geforce 400 não têm mais suporte oficial, isto é, drivers para Windows não são mais lançados com suporte a estes modelos, pela Nvidia, desde janeiro de 2019.[3]

Arquitetura editar

 Ver artigo principal: Microarquitetura Fermi

A Nvidia descreveu a microarquitetura Fermi como o próximo grande passo em sua linha de GPUs seguindo a microarquitetura Tesla usada desde o G80. O GF100, o primeiro produto da arquitetura Fermi, é grande: 512 processadores stream, em dezesseis grupos de 32, e 3,0 bilhões de transistores, fabricados pela TSMC em um processo de 40 nm. É o primeiro chip da Nvidia a suportar OpenGL 4.0 e Direct3D 11. Nenhum produto com uma GPU GF100 totalmente habilitada foi vendido. A GTX 480 tinha um multiprocessador de streaming desativado. A GTX 470 tinha dois multiprocessadores de streaming e um controlador de memória desabilitados. A GTX 465 tinha cinco multiprocessadores de streaming e dois controladores de memória desativados. As placas GeForce de consumo vêm com 256 MB anexadas a cada um dos controladores de memória GDDR5 habilitados, para um total de 1,5, 1,25 ou 1,0 GB; o Tesla C2050 tinha 512 MB em cada um dos seis controladores e o Tesla C2070 tinha 1024 MB por controlador. Ambos os cartões Tesla tinham quatorze grupos ativos de processadores de fluxo.

Os chips encontrados na marca Tesla de alto desempenho apresentam memória com ECC opcional e a capacidade de executar uma operação de ponto flutuante de precisão dupla por ciclo por núcleo; as placas GeForce do consumidor são artificialmente restritas a uma operação DP a cada quatro ciclos. Com esses recursos, combinados com suporte para Visual Studio e C++, a Nvidia direcionou-se aos mercados profissionais e comerciais, bem como ao uso em computação de alto desempenho.

Fermi recebeu o nome do físico italiano Enrico Fermi.

Limitações atuais e trade-offs editar

A quantidade de SRAM on-board por ALU na verdade diminuiu proporcionalmente em comparação com a geração anterior do G200, apesar do aumento do cache L2 de 256kB por 240 ALUs para 768kB por 512 ALUs, já que o Fermi tem apenas 32.768 registradores por 32 ALUs (vs. 16384 por 8 ALUs), apenas 48kB de memória compartilhada por 32 ALUs (vs. 16kB por 8 ALUs) e apenas 16kB de cache por 32 ALUs (vs. 8kB de cache constante por 8 ALUs + 24kB de cache de textura por 24 ALUs). Parâmetros como o número de registros podem ser encontrados na tabela de comparação de capacidade de computação CUDA no manual de referência.[4]

História editar

Em 30 de setembro de 2009, a Nvidia lançou um white paper descrevendo a arquitetura:[5] o chip possui 16 'Streaming Multiprocessors' cada um com 32 'CUDA Cores' capazes de uma operação de precisão única por ciclo ou uma operação de precisão dupla a cada dois cycle, um espaço de endereço virtual de 40 bits que permite que a memória do host seja mapeada no espaço de endereço do chip, o que significa que há apenas um tipo de ponteiro e tornando o suporte a C++ significativamente mais fácil, e uma interface de memória GDDR5 de 384 bits. Tal como acontece com o G80 e GT200, os encadeamentos são agendados em 'warps', conjuntos de 32 encadeamentos, cada um em execução em um único núcleo de sombreador. Enquanto o GT200 tinha 16 KB de 'memória compartilhada' associada a cada cluster de shader e exigia que os dados fossem lidos através das unidades de texturização se um cache fosse necessário, o GF100 tem 64 KB de memória associada a cada cluster, que pode ser usado como um Cache de 48 KB mais 16 KB de memória compartilhada ou como um cache de 16 KB mais 48 KB de memória compartilhada, juntamente com um cache L2 de 768 KB compartilhado por todos os 16 clusters.

O white paper descreve o chip muito mais como um processador de uso geral para cargas de trabalho que abrangem dezenas de milhares de threads - reminiscente da arquitetura Tera MTA, embora sem o suporte dessa máquina para acesso aleatório à memória muito eficiente - do que como um processador gráfico.

Muitos usuários relataram altes temperaturas e consumo de energia enquanto recebiam melhorias de desempenho correspondentemente ruims nas GPUs Fermi da série GeForce 400 quando comparadas com a Radeon HD 5000 Series do concorrente rival AMD - levando a AMD a criar e lançar um vídeo promocional "The Misunderstanding"[6] para cutucar diversão na questão. No vídeo, uma unidade policial é vista iniciando uma batida em uma casa com um grande perfil térmico, indicando uma operação de cultivo. No entanto, ao entrar na casa, fica claro que a fonte da alta temperatura é uma GPU Fermi.[7][8] Tornou-se uma piada comum que alguém poderia fritar um ovo em uma GPU Fermi em plena carga.[9]

Produtos editar

  • 1 SPs - Processadores de Shader - Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização
  • 2 Cada Streaming Multiprocessor (SM) na GPU da arquitetura GF100 contém 32 SPs e 4 SFUs. Cada Streaming Multiprocessor (SM) na GPU da arquitetura GF104/106/108 contém 48 SPs e 8 SFUs. Cada SP pode atender a 2 operações de adição e multiplicação fundidas de precisão única (FMA) por ciclo. Cada SFU pode cumprir quatro operações SF por ciclo. Uma operação FMA conta para duas operações de ponto flutuante. Portanto, o desempenho teórico de pico de precisão única, com contagem de shader [n] e frequência de shader [f, GHz], pode ser estimado pelo seguinte, FLOPSsp ≈ f × n × 2 (FMA). Potência de processamento total: para GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA) + 4 × 4 SFUs) e para GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) ou para GF100 FLOPSsp ≈ f × n × 2.5 e para GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.[10]

SP - Shader Processor (Unified Shader, CUDA Core), SFU - Special Function Unit, SM - Streaming Multiprocessor.

  • 3 Cada SM no GF100 contém 4 unidades de filtragem de textura para cada unidade de endereço de textura. A matriz GF100 completa contém 64 unidades de endereço de textura e 256 unidades de filtragem de textura.[11] Cada SM na arquitetura GF104/106/108 contém 8 unidades de filtragem de textura para cada unidade de endereço de textura. A matriz GF104 completa contém 64 unidades de endereço de textura e 512 unidades de filtragem de textura, a matriz GF106 completa contém 32 unidades de endereço de textura e 256 unidades de filtragem de textura e a matriz GF108 completa contém 16 unidades de endereço de textura e 128 unidades de filtragem de textura.[12]

Todos os produtos são produzidos em um processo de fabricação de 40 nm. Todos os produtos suportam Direct3D 12.0 em um nível de recurso 11_0, OpenGL 4.6 e OpenCL 1.1. A única exceção é a GeForce 405, uma placa somente OEM, que é baseada no núcleo GT218 (Tesla) suportando apenas DirectX 10.1, OpenGL 3.3 e sem suporte a OpenCL, e é a única placa da linha GeForce 400 não baseada no Microarquitetura de Fermi. Pelos parâmetros, a GeForce 405 é idêntica à GeForce 310, também uma placa somente OEM, que é baseada na GeForce 210. Todos os produtos têm um único conector DB15 VGA em uma placa de altura e comprimento total, exceto conforme listado em contrário.

Em 8 de novembro de 2010, a Nvidia lançou o chip GF110, junto com o GTX 580 (substituto do 480). É um chip GF100 redesenhado, que usa significativamente menos energia. Isso permitiu que a Nvidia habilitasse todos os 16 SMs (todos os 16 núcleos), o que antes era impossível no GF100. Vários recursos da arquitetura GF100 estavam disponíveis apenas nas séries de placas Quadro e Tesla, mais caras.[13] Para os produtos de consumo GeForce, o desempenho de precisão dupla é um quarto do desempenho da arquitetura Fermi "completa". A verificação e correção de erros de memória (ECC) também não funciona em cartões de consumo.[14] As placas GF100 fornecem Compute Capability 2.0, enquanto as placas GF104/106/108 fornecem Compute Capability 2.1.

Tabela de chipsets editar

Modelo Lançamento Nome do código Fab (nm) Transistores (Milhões) Tamanho da matriz (mm2) contagem de SM Core config[a][b] taxa de clock Taxa de preenchimento Configuração de memória Suporte API (versão) Poder de processamento (GFLOPS)[c] TDP (Watts)[d] Preço de lançamento (USD)
Core (MHz) Shader (MHz) Memória (MHz) Pixel (GP/s) Textura (GT/s) Tamanho (MB) Largura de banda (GB/s) tipo DRAM Largura do barramento (bit) Vulkan Direct3D OpenGL OpenCL[e] precisão única precisão dupla
GeForce 405[f] 16 de setembro de 2011 GT216
GT218
40 nm 486
260
100
57
1 48:16:8
16:8:4
475
589
1100
1402
800
790
3.8
2.36
7.6
4.71
512
1024
12.6 DDR3 64 n/a[17] 10.1 3.3 1.1 105.6
44.86
Desconhecido 30.5 OEM
GeForce GT 420 3 de setembro de 2010 GF108 TSMC 40 nm 585 116 48:4:4 700 1400 1800 2.8 2.8 512 28.8 GDDR3 128 12 FL 11_1 4.6 134.4 Desconhecido 50
GeForce GT 430 11 de outubro de 2010 GF108
GF108-300-A1
2 96:16:4 1600
1800
11.2 512 25.6
28.8
1.2 268.8 Desconhecido 60
1800 512
1024
2048
28.8 128 1.1 268.8 Unknown 49 $79
1300 10.4 64
GeForce GT 440 1 de fevereiro de 2011 GF108 810 1620 1800
3200
3.2 12.9 1024 28.8
51.2
GDDR3
GDDR5
128 311.04 Desconhecido 65 $100
11 de outubro de 2010 GF106 1170 238 3 144:24:24 810 1620 1800 4.8 19.4 1536
3072
43.2 DDR3 192 342.43 Desconhecido 56 OEM
GeForce GTS 450 790 1580 4000 4.7 18.9 1536 96.0 GDDR5 455.04 Desconhecido 106
13 de setembro de 2010
15 de março de 2011
GF106-250
GF116-200
4 192:32:16 783 1566 1200-1600 (GDDR3)
3608 (GDDR5)
6.2 25.0 512
1024
57.7 128 601.34 Desconhecido 106 $129
GeForce GTX 460 SE 15 de novembro de 2010 GF104-225-A1 1950 332 6 288:48:32 650 1300 3400 7.8 31.2 1024 108.8 256 748.8 Desconhecido 150 $160
GeForce GTX 460 11 de outubro de 2010 GF104 7 336:56:32 9.1 36.4 1024 108.8 873.6 Desconhecido OEM
12 de julho de 2010 GF104-300-KB-A1 336:56:24 675 1350 3600 9.4 37.8 768 86.4 192 907.2 Unknown $199
336:56:32 1024
2048
115.2 256 160 $229
24 de setembro de 2011 GF114 336:56:24 779 1557 4008 10.9 43.6 1024 96.2 192 1045.6 Desconhecido $199
GeForce GTX 465 31 de maio de 2010 GF100-030-A3 3000[18] 529 11 352:44:32 608 1215 3206 13.3 26.7 1024 102.7 256 1.2 855.36 106.92 200[d] $279
GeForce GTX 470 26 de março de 2010 GF100-275-A3 14 448:56:40 3348 17.0 34.0 1280 133.9 320 1088.64 136.08 215[d] $349
GeForce GTX 480 26 de março de 2010 GF100-375-A3 15 480:60:48 701 1401 3696 21.0 42.0 1536 177.4 384 1344.96 168.12 250[d] $499
Modelo Lançamento Nome do código Fab (nm) Transistores (Milhões) Tamanho da matriz (mm2) contagem de SM Core config[a][b] taxa de clock Taxa de preenchimento Configuração de memória Suporte API (versão) Poder de processamento (GFLOPS)[c] TDP (Watts)[d] Preço de lançamento (USD)
Core (MHz) Shader (MHz) Memória (MHz) Pixel (GP/s) Textura (GT/s) Tamanho (MB) Largura de banda (GB/s) tipo DRAM Largura do barramento (bit) Vulkan Direct3D OpenGL OpenCL[e] precisão única precisão dupla
  1. a b Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização
  2. a b Cada SM no GF100 contém 4 unidades de filtragem de textura para cada unidade de endereço de textura. A matriz GF100 completa contém 64 unidades de endereço de textura e 256 unidades de filtragem de textura.[11] Cada SM na arquitetura GF104/106/108 contém 8 unidades de filtragem de textura para cada unidade de endereço de textura, mas dobrou as unidades de endereçamento e filtragem. A matriz GF104 completa também contém 64 unidades de endereço de textura e 512 unidades de filtragem de textura, apesar da contagem de SM reduzida pela metade, a matriz GF106 completa contém 32 unidades de endereço de textura e 256 unidades de filtragem de textura e a matriz GF108 completa contém 16 unidades de endereço de textura e 128 unidades de filtragem de textura.[15]
  3. a b Para calcular o poder de processamento veja Microarquitetura Fermi#Performance.
  4. a b c d e Observe que, embora o TDP da GTX 460 seja comparável ao da série HD5000 da AMD, as placas baseadas em GF100 (GTX 480/470/465) têm uma classificação muito inferior, mas consomem significativamente mais energia, por exemplo, GTX 480 com TDP de 250 W consome Mais potência do que uma HD 5970 com TDP de 297 W.[16]
  5. a b A série 400 é a única família não OEM das séries GeForce 9 a 700 que não inclui um sistema oficial de GPU dupla. No entanto, em 18 de março de 2011, EVGA lançou a primeira placa de PCB simples com 460 duplos integrados. A placa vinha com 2.048 MB de memória a 3.600 MHz e 672 processadores shader a 1.400 MHz e era oferecida pelo preço sugerido de $ 429
  6. A placa GeForce 405 é uma GeForce 310 renomeada, que por sua vez é uma GeForce 210 renomeada.

Suporte descontinuado editar

A Nvidia anunciou que, após a versão 390 dos drivers, não lançará mais drivers de 32 bits para sistemas operacionais de 32 bits.[19]

A Nvidia anunciou em abril de 2018 que o Fermi mudará para o status de suporte de driver legado e será mantido até janeiro de 2019.[20]

Ver também editar

Notas

Referências

  1. Killian, Zak (3 de julho de 2017). «Nvidia finally lets Fermi GPU owners enjoy DirectX 12». Tech Report. Consultado em 17 de março de 2023 
  2. «OFFICIAL: NVIDIA says GT300 on schedule for Q4 2009, yields are fine - Bright Side Of News*». Brightsideofnews.com. 25 de setembro de 2009. Consultado em 17 de março de 2023 
  3. NVIDIA Ends Driver Support For Fermi (GeForce 400 / 500 Series) GPUs, Moved To Legacy Status – 32-bit OS Drivers Support Also Ended site: wccftech
  4. Compute Capability Comparison Table in «Page 147-148, Appendix G.1, CUDA 3.1 official reference manual» (PDF) . Page 97 in Appendix A lists the older NVIDIA GPUs and shows all G200 series to be compute capability 1.3, while Fermi-based cards have compute capability 2.x (page 14, Section 2.5).
  5. http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf
  6. Archived at Ghostarchive and the Wayback Machine: «The Misunderstanding - Presented by AMD». YouTube 
  7. «AMD Pokes Fun of NVIDIA's Fermi GPU Heat Output in "The Misunderstanding" Video». 9 de agosto de 2010 
  8. «NVIDIA Fermi GF100 GPUs - Too little, too late, too hot, and too expensive». ZDNet 
  9. «GeForce GTX 480: Is it Hot Enough to Fry an Egg?». Consultado em 17 de março de 2023. Arquivado do original em 20 de setembro de 2019 
  10. siliconmadness.com (2010). «Nvidia Announces Tesla 20 Series». Arquivado do original em 21 de maio de 2010 
  11. a b «The GF100 Recap - Nvidia's GeForce GTX 480 and GTX 470: 6 Months Late, Was It Worth the Wait?». Anandtech.com. Consultado em 17 de março de 2023. Cópia arquivada em 5 de agosto de 2011 
  12. NVIDIA’s GeForce GTX 460: The $200 King
  13. «Statement by NVIDIA on their General CUDA GPU Computing Discussion forum». Cópia arquivada em 22 de julho de 2011 
  14. «NVIDIA Tesla C2xxx webpage» , note from the description one may infer that on Teslas, ECC may be switched on and off using 1/8 of existing on-board memory, unlike standard ECC memory modules which requires 1/8 extra memory chips (that is, one extra chip to be mounted on the printed circuit board for every 8).
  15. «GF104: Nvidia Goes Superscalar - Nvidia's GeForce GTX 460: The $200 King». Anandtech.com. Consultado em 17 de março de 2023. Cópia arquivada em 22 de dezembro de 2015 
  16. «GeForce GTX 480 And 470: From Fermi And GF100 To Actual Cards!». Tomshardware.com. 27 de março de 2010. Consultado em 17 de março de 2023 
  17. «The Khronos Group». 31 de maio de 2022 
  18. «Nvidia Fermi Compute Architecture Whitepaper» (PDF). Consultado em 17 de março de 2023. Cópia arquivada (PDF) em 22 de novembro de 2009  ( 855KB), page 11 of 22
  19. «Support Plan for 32-bit and 64-bit Operating Systems | NVIDIA». nvidia.custhelp.com. Consultado em 17 de março de 2023 
  20. «Support Plan for Fermi series GeForce GPUs | NVIDIA». nvidia.custhelp.com. Consultado em 17 de março de 2023 

Ligações externas editar

 
O Commons possui uma categoria com imagens e outros ficheiros sobre GeForce 400