A AMD enviou aos fundadores da startup tiny corp as placas de aceleração de IA de topo MI300X, cujo fundador, George Hotz, desbloqueou o iPhone aos 17 anos. Hotz acredita que o moat da NVIDIA com CUDA não é intransponível e desenvolveu, com cerca de 20 mil linhas de código, a pilha de aprendizado profundo de código aberto tinygrad, buscando desafiar o ecossistema CUDA do lado do software. Até maio de 2026, a capitalização de mercado da NVIDIA era cerca de sete vezes a da AMD, uma redução em relação à diferença de 16 vezes observada um ano antes. A tiny corp também vende computadores Tinybox baseados em hardware da AMD, com o objetivo de tornar a capacidade de processamento uma mercadoria.Autor e fonte do artigo: Nova Inteligência
Em março de 2025, George Hotz publicou um artigo em seu blog pessoal com o título composto apenas por duas palavras: AMD YOLO, significando "sem nenhum caminho de volta, tudo em AMD".
Hotz escreveu no artigo: a AMD está enviando as duas unidades MI300X (a aceleradora AI de data center mais avançada da AMD) que pedimos, e já estão a caminho.
O MI300X é o produto estrela da AMD na aposta em poder de computação para IA, normalmente esgotado logo que chega, com fornecedores de nuvem e empresas de grandes modelos aguardando na fila. Agora, ele está sendo enviado para a tiny corp: uma pequena empresa que nem mesmo tinha escritório e operava apenas por meio do GitHub e do Discord.
E o destinatário deste pacote, conhecido no mundo como geohot — George Hotz.
Geohot tornou-se conhecido pela primeira vez em um vídeo de 2007. Na época, com 17 anos, ele desbloqueou um iPhone pela primeira vez.
Em 2007, George Hotz, com 17 anos, exibiu diante da câmera o primeiro iPhone desbloqueado do mundo; o vídeo teve quase dois milhões de visualizações, tornando o nome geohot famoso em todo o círculo de hackers.
Mais tarde, ele foi processado por quebrar o Sony PS3. E desta vez, ele queria fazer algo ainda maior: abrir brecha no muro de proteção da CUDA da NVIDIA pelo lado do software.
"CUDA é um ecossistema, não uma vantagem competitiva"
"CUDA é um ecossistema, não uma barreira."
Hotz disse sem rodeios em seu blog que o CUDA (plataforma de computação GPU da NVIDIA) não é a vantagem competitiva que as pessoas imaginam, é apenas um ecossistema inicial.
Ele publicou uma captura de tela do Twitter em seu blog. Já em janeiro de 2025, ele chamou o envio do chip da AMD de um "teste cultural": ver se a AMD realmente estaria disposta a investir em software.
Neste blog post de março, ele concluiu que a AMD passou no teste. Ele acredita que a AMD não abandonará o software, e, se for esse o caso, a NVIDIA não tem nenhuma razão para ser 16 vezes mais cara que a AMD.
Ou seja, na época, a capitalização de mercado da NVIDIA era cerca de 16 vezes a da AMD, e os hardwares das duas empresas na realidade não eram tão diferentes. A AMD até criou um Tensor Core com o dobro do throughput na arquitetura RDNA4, enquanto a NVIDIA artificialmente reduziu pela metade em seus próprios cartões.
De onde vem essa diferença de 16 vezes? A resposta de Hotz é o software. Mais precisamente, a complexidade do software e o bloqueio ecológico gerado por essa complexidade.
Desenvolvedores estão acostumados com CUDA, e a cadeia de ferramentas gira em torno da CUDA, então, por mais boa que seja a hardware da AMD, ninguém quer tocar. O que prende a AMD nunca foi o chip, mas sim a falta de uma pilha de software competitiva.
Claro, essa é a avaliação de Hotz, não uma conclusão oficial da AMD.
Ele não apenas falou, mas também investiu pessoalmente 250 mil dólares em AMD, assumindo publicamente uma posição positiva e apostando por cinco anos. Ele escreveu em seu blog:
Ou NVIDIA está fortemente superavaliada, ou AMD está fortemente subavaliada.Hotz escreveu isso em março de 2025, quando a capitalização de mercado da NVIDIA era aproximadamente 16 vezes a da AMD.
At maio de 2026, a capitalização de mercado da NVIDIA era de aproximadamente US$ 5,2 trilhões, enquanto a da AMD era de cerca de US$ 760 bilhões, reduzindo a diferença para cerca de 7 vezes. Durante esse ano, as ações da AMD subiram significativamente impulsionadas pela demanda por data centers de IA, com aumento muito superior ao da NVIDIA.
Claro que isso não prova que Hotz está certo. A reavaliação da AMD vem principalmente de suas próprias entregas de GPU e resultados financeiros, mas a direção do sentimento do mercado realmente confirma o julgamento de Hotz: essa diferença de 16 vezes não é tão sólida quanto se imaginava.
Da desbloqueio do iPhone à desafio da hegemonia de poder de cálculo
Um programador que nunca havia fabricado um chip, por que ousaria desafiar a NVIDIA? A história começa quando ele tinha 17 anos.
No verão de 2007, a Apple lançou o primeiro iPhone, exclusivamente vinculado à AT&T. Hotz, com 17 anos e usuário da T-Mobile, queria o iPhone sem trocar de operadora, então decidiu desmontar o aparelho.
Segundo relato da The New Yorker, ele abriu a tampa traseira com um chave de fenda, encontrou o processador de baseband que restringia a operadora, soldou um fio e aplicou voltagem para perturbar seu código. Na manhã seguinte, ele declarou diante da câmera: “Este é o primeiro iPhone desbloqueado do mundo.”
O vídeo gerou quase dois milhões de visualizações, tornando-o o hacker mais famoso do mundo na época. Dois anos depois, ele passou a atacar o Sony PS3, quebrando o console de jogos considerado inquebrável, e foi processado pela Sony, resultando em um acordo.
Em 2011, a Sony processou George Hotz por quebrar o PS3, e o caso terminou com um acordo extrajudicial, no qual Hotz aceitou uma ordem judicial permanente e se comprometeu a não mais tocar em produtos da Sony.
Hotz tem uma definição simples para hacker: hacker é para computador o que o encanador é para tubulações.
Sua metodologia não mudou em mais de uma década: em um sistema fechado, encontrar o componente que pode "conversar" com você e depois encontrar maneiras de fazê-lo obedecer.
Reescrita de toda a pilha AMD com vinte mil linhas de código
iPhone e PS3 provaram a capacidade de Hotz.
Mas para aproveitar o CUDA, uma única pessoa não basta; é preciso ter algo real, e é aí que entra o tinygrad. É uma pilha de aprendizado profundo de código aberto liderada por Hotz.
Na verdade, a obsessão de Hotz em "quebrar sistemas fechados" já se estendeu da eletrônica de consumo para a indústria. Em 2015, ele fundou a empresa de condução autônoma comma.ai e, quase sozinho, modificou em sua garagem um sistema de condução autônoma capaz de operar em rodovias, em comparação com a Tesla.
A comma.ai ainda está em operação, e seu modelo de direção aberto, openpilot, roda exatamente no tinygrad.
O GitHub oficial o descreve como um sistema end-to-end: incluindo biblioteca de tensores, diferenciação automática, IR (representação intermediária) e compilador, além de compilação just-in-time, execução de gráficos e componentes de otimizador e carregamento de dados necessários para treinamento.
A principal característica deste sistema é a "simplicidade extrema".
O tinygrad já suporta múltiplos backends, incluindo CUDA, AMD, METAL, QCOM e WEBGPU. Enquanto outras plataformas precisam implementar um conjunto complexo de instruções para adaptar um novo hardware, o tinygrad só requer que o novo hardware consiga executar cerca de 25 operações básicas, como adição, subtração, multiplicação e divisão, para ser integrado.
Mas o verdadeiro campo de batalha em que Hotz se concentrou é a linha da AMD.
Em janeiro de 2025, a tiny corp já havia escrito seus próprios drivers, runtime, bibliotecas e simulador. Na época, essa pilha AMD consistia em aproximadamente 12.000 linhas de código, faltando apenas um assembler RDNA3 para ser “totalmente autônoma”.
Em março, Hotz anunciou em seu blog que a tiny corp já tinha uma pilha completa da AMD, desde o hardware até a camada PyTorch, com a única exceção sendo o framework de compilador LLVM.
Ele também acrescentou: os desenvolvedores nem precisam aprender a escrever em tinygrad; podem continuar usando o código PyTorch familiar, pois o sistema subjacente converterá automaticamente para esta pilha da AMD.
12.000 linhas são apenas o tamanho da versão da pilha AMD de janeiro de 2025. O projeto tinygrad continua crescendo, e na v0.13.0 já chegou a 22.853 linhas; o próprio Hotz forneceu, no final de 2025, o número de 18.935 linhas sem os testes.
Mas, seja 12.000 ou 18.000, ambos são comparações impressionantes dentro do contexto da indústria.
Um stack de software capaz de acionar uma GPU e executar treinamento tem geralmente milhões de linhas. Em palavras de Hotz, tinygrad é 1000 vezes menor que eles.
Isso significa que a complexidade do CUDA não é baseada em leis físicas. Pode ser reescrita por uma pequena equipe com uma abordagem minimalista, o que é exatamente o que Hotz acredita.
Tinybox coloca uma máquina de hash na prateleira
Se a história terminasse aqui, o tinygrad ainda seria apenas um projeto no GitHub, mas a ambição de Hotz vai além do código.
A Tiny Corp está oficialmente vendendo um computador chamado Tinybox. No site oficial, estão listados os modelos Red, Green, Pro e Exa, com especificações, preços e informações de envio totalmente divulgados; o envio ocorre dentro de uma semana após o pagamento e o pedido.
Tinybox já foi comparado em testes de referência MLPerf Training 4.0 com máquinas cerca de 10 vezes mais caras. Segundo Hotz, em seu blog no final de 2025, essa linha de vendas de computadores gera aproximadamente US$ 2 milhões em receita por ano, dinheiro que ele usa para financiar toda a pesquisa e desenvolvimento da tiny corp.
No mesmo blog post, Hotz também mencionou que assinaram um contrato com a AMD para usar o MI350X para executar o treinamento MLPerf do Llama 405B, e que o processo de negociação desse contrato foi basicamente realizado publicamente no Twitter.
A tiny corp escreveu sua missão em uma frase: commoditize the petaflop.
Petaflop é uma unidade de poder de processamento, referindo-se a um quadrilhão (10 elevado à 15ª potência) de operações de ponto flutuante por segundo, sendo uma unidade comum para medir o poder de computação de supercomputadores e IA.
O que Hotz quer fazer é comercializar os petaflops por segundo, tornando a IA acessível a todos.
Quando a capacidade de mineração puder ser precificada, encomendada e entregue em uma semana, como produtos eletrônicos de consumo, a narrativa da "escassez de capacidade" pode começar a se desfazer.
Uma nova rota
O significado da história de Hotz não está no ponto alto de "um hacker enfrentando a NVIDIA e encerrando o CUDA". O CUDA ainda é a opção padrão para a maioria dos desenvolvedores.
O que realmente importa é a suposição que Hotz apostou: a complexidade da pilha de software de IA pode ser comprimida até um tamanho extremamente pequeno. Uma vez comprovada, a parte da avaliação da NVIDIA sustentada pelo CUDA pode precisar ser reavaliada.
E esse jogo já não é mais apenas uma questão de Hotz. Em seu artigo de fim de 2025, “Cinco anos do tinygrad”, ele escreveu: “A primeira linha de código foi enviada em outubro de 2020; cinco anos depois, a empresa agora tem seis pessoas, e muitos já investiram vários anos.”
Para Hotz, os problemas de hardware da AMD não são grandes; o ponto crucial é o software. Essa é uma avaliação de um empreendedor, não uma declaração oficial da AMD. Quantos desses 16 vezes de prêmio de valorização de mercado da NVIDIA são atribuídos ao hardware e quantos à parede de software que está sendo desmontada linha por linha?
Hotz definiu um prazo de cinco anos para sua aposta de US$ 250.000: volte para ver depois.
Ainda não se sabe se esta aposta será vista como um delírio de um hacker ou como o ponto de partida de um novo caminho. Mas a espessura da muralha de poder de hash já está sendo remedida por alguns com código.
