OpenAI apresenta o chip Jalapeño para inferência de LLM, com objetivo de implantação em escala de gigawatt até 2026

icon MarsBit
Compartilhar
AI summary iconResumo

Segundo observações da Beating, a OpenAI lançou seu primeiro chip acelerador personalizado para inferência de modelos de linguagem de grande porte (LLM), chamado Jalapeño (pimenta jalapeño, também conhecido como "processador inteligente"). A OpenAI é responsável pela arquitetura e design algorítmico do chip, colaborando com a Broadcom e a Celestica para impulsionar a produção industrial em larga escala. O Jalapeño tem como objetivo aumentar diretamente a velocidade e reduzir os custos de computação para o ChatGPT, Codex, interfaces de API e futuros produtos de agentes inteligentes. Graças ao suporte do avançado modelo de IA da própria OpenAI no design, o Jalapeño passou da concepção inicial ao tape-out em apenas nove meses, estabelecendo o recorde mais rápido de desenvolvimento para um ASIC de alto nível. O chip adota um design co-otimizado entre algoritmo e hardware, reestruturado em torno de núcleos dedicados a LLMs, movimentação de dados e arquitetura de rede, alcançando uma utilização prática próxima ao limite teórico do hardware. As primeiras amostras de engenharia já executaram com sucesso cargas de trabalho como GPT-5.3-Codex-Spark, nas frequências e consumo de energia alvo do laboratório, com eficiência energética significativamente superior aos dispositivos de computação de ponta atuais. Na divisão tecnológica da cadeia de suprimentos, a Broadcom é responsável principalmente pela implementação em silício e tecnologias de conexão de rede do Jalapeño, integrando o chip Tomahawk; a Celestica fornece suporte para a placa única, rack e integração do sistema. Como o primeiro produto da rota de evolução da plataforma de computação de múltiplas gerações, o Jalapeño está programado para início da implantação em larga escala em data centers gigawatt, em parceria com empresas como a Microsoft, até o final de 2026, visando expandir a capacidade da plataforma completa e reduzir os custos de inferência.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.