Nvidia vai fabricar computador de centenas de milhões de dólares em Israel para alavancar IA
A Nvidia é uma empresa norte-americana, sediada na Califórnia, fundada por um imigrante de Taiwan, mais conhecida por suas placas de vídeo para computadores e celulares. Ela não fabrica os chips nos EUA. Eles são terceirizados em Taiwan, ao contrário das outras megaempresas, inclusive Apple, que fabricam na China.
Vamos tentar ser os menos técnicos possível neste artigo, pois a realidade está tão avançada que não só é difícil entender, mas também difícil explicar. Tudo se resume neste momento a uma corrida muita veloz para multiplicar a capacidade da inteligência artificial – IA, nas diversas empresas que a desenvolvem.
Menos de um ano atrás, ficou comprovado que as CPUs dos computadores como as da IBM e AMD, conhecidas por nós como I3, I5, I7, I9, Ryzen etc, com 4 a 10 núcleos e processamento tanto sequencial como paralelo (cada núcleo processa duas instruções ao mesmo tempo), são LENTAS DEMAIS para IA. Uma empresa começou a utilizar as placas de vídeo da Nvidia para processar programas e não jogos de computador e o resultado foi espantoso. Considere que placas de vídeo básicas da Nvidia tem 750 CUDAS, podemos dizer, 750 processadores controlados por um programa, dentro do hardware criado pela empresa, denominado CUDA (Compute Unified Device Architecture – Arquitetura Unificada de Dispositivos de Computação). Isso permite a execução de 750 instruções ao mesmo tempo.
As placas de vídeo de última geração à venda no mercado são dos modelos RDX 4090, com 24 GB de memória (isso mesmo, 24 GB só para o vídeo), é são DDR6X (mais velozes que você pode imaginar) e um absurdo de 16.384 CUDAS, dez vezes mais que a geração anterior. Pode ficar de boca aberta e é isso mesmo que você já entendeu. Ao invés de 16 instruções ao mesmo tempo que uma CPU de 8 cores do seu computador ou telefone realizam, esta placa faz mais de 16.000 – AO MESMO TEMPO. Obvio que o consumo de eletricidade é muito alto. No uso normal de um computador fica em torno dos 19 watts, subindo para 25 w durante a exibição de um vídeo e 315 w durante um jogo de última geração. Precisa de uma fonte de 850 w reais no PC, provavelmente mais que o dobro da que está em seu computador.
No Brasil uma placa destas é muito cara, em torno de 16 mil reais. Nos EUA custa 1.700 dólares.
E é esta tecnologia de CUDAs que está sendo utilizada no Chat GTP e todas as outras IAs do mercado e em desenvolvimento. Se você sempre quis saber qual é o computador que roda o Chat GPT, é um complexo com milhares de placas baseadas nos CUDAs da Nvidia. A informação completa sobre o hardware é mantida em sigilo, mas a Microsoft está trabalhando a IA dela com 10.000 placas Nidvia. Avisei lá no começo que estava difícil de entender e de explicar. Grosso modo seriam 160 milhões de instruções processadas AO MESMO TEMPO!
E talvez isso permita ao leitor imaginar, apenas imaginar, como uma IA pode responder a qualquer coisa (dentro de limites impostos), entre 1 a 4 segundos após a pergunta, em qualquer língua para seu computador ou celular, enquanto está respondendo outras questões a dezenas de milhares de pessoas AO MESMO TEMPO em TODAS AS LÍNGUAS HUMANAS.
Mas isso é só o começo do desenvolvimento da IA. E parece não haver barreiras, pois a IA será utilizada para criar novos programas de computador e novas arquiteturas de chips para aumentar seu próprio potencial e o potencial de tudo relacionado à informática.
UMA VOLTA AO INÍCIO DA INFORMÁTICA
Talvez o leitor saiba que o primeiro computador comercial foi o UNIVAC 1 (UNIVersal Automatic Computer – Computador Automático Universal), do ano de 1951, utilizava 5.200 válvulas, pesava 13 toneladas e consumia 125.000 Watts para fazer 1.905 operações matemáticas de soma por segundo. Possuia 1 kb de memória em mercúrio e cristais piezolétricos.
Obviamente que 10.000 placas consumindo 315 Watts cada uma exige o 3.150.000 Watts, tem 240 Terabytes de memória, e pesam aproximadamente 3 toneladas, sem contabilizar os suportes metálicos, sistemas elétricos, cabos etc. Portanto, estamos utilizando uma área muito semelhante a de 1951, mas com um desempenho de fato, futurista.
Da mesma forma que o UNIVAC gigante levou a miniaturização, contemporânea, nossas Ias gigantescas também vão migrar para o nano universo do infinitamente pequeno.
ENTÃO O QUE A NVIDIA VAI FAZER EM ISRAEL?
O projeto é simples: a construção com computador Israel-1, a IA mais rápida do planeta Terra. E o trabalho começa esta semana.
A construção do Israel-1, ao mesmo tempo vai permitir reformar todas as outras IAs em operação, com outro avanço inimaginável obtido pela Nvidia. Existia um gargalo para as IAs e operações em nuvem devido a velocidade de transmissão de dados entre as placas que constituem a IA. A sua rede de computador em casa, provavelmente é “Fast Ethernet” (com velocidade máxima de 100 Mbits/s – cem milhões de bits por segundo), ou se você estiver atualizado, é uma “Gigabit Ethernet” que pode trafegar 1.000 Mbits/s, ou seja um bilhão de bits por segundo, 1 Gbps.
A Nvidia apresentou hoje, 29/mai/2023 a plataforma Spectrum-X capaz de trafegar 800 Gbps, ou seja 800.000 Mbits/s, isto é 800 bilhões de bits por segundo. Consegue visualizar isso? Então você é um iluminado! Podemos escrever, podemos usar, mas dificilmente poderemos entender.
O UNIVAC-1 tinha 5.200 válvulas. Apenas uma unidade Spectrum-X que trafega dados, possui 100 bilhões de transistores.
Tanto o Israel-1 quanto as outras IA vão para este padrão de 800 Gbps. Mas agora fica mais difícil ainda de compreender. Lembra ali em cima do espantoso UNIVAC-1 e suas 1.905 somas por segundo? O Israel-1 fará UM QUINTILHÃO de somas por segundo, gramaticalmente isto aqui: 1.000.000.000.000.000.000/s. Isso significa que ele vai poder executar 100 trilhões de instruções por segundo. E você achava que as 160 milhões de operações por segundo que a IA da Microsoft pode realizar era espetacularmente incompreensível. Tudo está mudando muito velozmente.
Atualmente o ChatGPT utiliza os processadores 4.480 placas Nvidia GV100 capazes de 1 trilhão de operações por segundo, mais 71.680 CPUs AMDEPYC 7742. Portanto é um Fusca, comparado com um carro da Fórmula 1 que vem por aí. O ChatGPT-4 professional utiliza 285.000 CPUs Intel Xeon (quadra core) mais 10.000 placas Nvidia GV100.
O centro deste computador inacreditável não mais serão CPUs (central processing unit – unidade central de processamento). O funcionamento mudou tanto que o nome também mudou para DPU (data processing unit – unidade de processamento de dados) BlueField-3 (na foto principal), desenvolvida e produzida em Israel, que mais uma vez dispara uma revolução na informática. A DPU foi desenvolvida apenas para supercomputadores de nuvem.
Tente entender o BlueField-3 como uma placa de “cpu” que pode trafegar 400 Gbps com 32 Gbytes de memória integrada. Cada cabo de um Spectrum-X vai para uma BlueField-3.
A Nvidia chegou ao Spectrum-X, usando sua capacidade econômica para desenvolver os projetos ainda não realizados de outra empresa israelense, a Mellanox, que dominava o setor mundial de servidores de alta velocidade e armazenamento de dados em nuvem. Foi uma aquisição impactante de 7 bilhões de dólares em 2020, em plena pandemia. Ninguém teve do que reclamar.
A Nvidia atualmente possui 3.000 funcionários em Israel, o maior número fora dos EUA, em centros de desenvolvimento em Tel Aviv, Jerusalém, Ra’anana, Beersheba e Yokne’am, onde fica a Mellanox. A empresa está ainda envolvida com 800 startups em Israel, pois sabe que vem mais coisa boa pela frente.
E se alguém estiver interessado, tudo isso está sendo realizado dentro da engenharia de hardware convencional, sem nanotecnologia, sem grafeno e absolutamente nada de computação quântica, que a Google está operando há mais de um ano.
Dizem os entendidos, inclusive um amigo que trabalha no Chat GPT que quando a computação quântica se tornar comercial, todos estes trilhões e quintilhões de instruções somas por segundo vão ficar na poeira e as IAs vão ganhar individualidade e consciência. Será?
Por José Roitberg – jornalista e pesquisador.