Tether lança o framework BitNet LoRA multiplataforma para treinar modelos de IA com bilhões de parâmetros em dispositivos de consumo

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A Tether anunciou um framework cross-platform BitNet LoRA para notícias on-chain e notícias de IA + cripto, permitindo que modelos de IA de bilhões de parâmetros sejam treinados em dispositivos de consumo. O framework, parte do QVAC Fabric, otimiza o BitNet da Microsoft para baixo uso computacional e de memória. Ele suporta Adreno, Mali, Apple Bionic e mais, com modelos de 1B ajustados em cerca de uma hora. Hardware não-NVIDIA agora suporta treinamento de LLMs de 1 bit. Modelos BitNet operam de 2 a 11 vezes mais rápido em GPUs móveis do que em CPUs, usando 77,8% menos VRAM do que modelos de 16 bits. A Tether afirma que a tecnologia reduz a dependência de nuvem e suporta treinamento descentralizado de IA.

Odaily Planet Daily noticia que, conforme anúncio oficial, a Tether lançou o framework de fine-tuning BitNet LoRA no QVAC Fabric, otimizando o treinamento e a inferência do Microsoft BitNet (LLM de 1-bit). Esse framework reduz significativamente as exigências de poder computacional e memória, permitindo que modelos de bilhões de parâmetros sejam treinados e ajustados em notebooks, GPUs de consumo e smartphones.

Este é o primeiro esquema a permitir o fine-tuning de modelos BitNet em GPU móvel (incluindo Adreno, Mali e Apple Bionic). Os testes mostram que um modelo de 125M parâmetros pode ser ajustado em cerca de 10 minutos, um modelo de 1B em aproximadamente uma hora, e até mesmo escalado para modelos de 13B parâmetros em dispositivos móveis.

Além disso, o framework suporta hardware heterogêneo, como Intel, AMD e Apple Silicon, e pela primeira vez permite o fine-tuning LoRA de LLMs em 1-bit em dispositivos não NVIDIA. Em termos de desempenho, os modelos BitNet apresentam velocidade de inferência 2 a 11 vezes maior em GPU móvel em comparação com CPU, além de reduzir o uso de memória de vídeo em até 77,8% em comparação com modelos tradicionais de 16-bit.

A Tether afirma que essa tecnologia tem o potencial de romper a dependência de poder de processamento avançado e infraestrutura em nuvem, impulsionando o treinamento de IA em direção à descentralização e localização, e fornecendo base para novos cenários de aplicação, como o aprendizado federado.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.