Firecrawl, PDF İşleyicisini Rust'ta Yeniden Yazıyor, Hız Artışı En Fazla 5,7 Kat

iconKuCoinFlash
Paylaş
AI summary iconÖzet

ME Haberleri'ne göre, 15 Nisan (UTC+8), 1M AI News izleme verilerine göre, web veri çıkarma aracısı Firecrawl, Rust ile yeniden yazılmış bir PDF çözümleme motoru olan Fire-PDF'i duyurdu. Bu araç, PDF'leri yapılandırılmış Markdown'a dönüştürme hızını önceki neslin 3,5 ila 5,7 katına çıkardı ve ortalama sayfa işleme süresi 400 milisaniyenin altına düştü. Hız artışı, gereksiz GPU çağrılarını azaltarak sağlandı. Firecrawl, aynı zamanda Rust kütüphanesi pdf-inspector'u açık kaynak olarak yayınladı; bu kütüphane, her PDF sayfasını milisaniye cinsinden sınıflandırır: metin içeren sayfalar doğrudan yerel olarak çıkarılır ve GPU atlanır; yalnızca taranmış veya görsellerle yoğun sayfalar, sinir ağı düzen modeline ve GLM-OCR görsel dil modeline gönderilir. Örneğin, 150 sayfa metin ve 60 sayfa taranmış belgeden oluşan bir finansal raporda, çoğu sayfa GPU gerektirmemektedir. Doğruluk açısından, Fire-PDF farklı içerik türleri için ayrı parametreler ayarlar: tablolar daha yüksek token limiti ve en fazla 25 saniye üretim süresi alır; formüller LaTeX formatında korunur; çok sütunlu düzenler sinir ağı ile okuma sırası tahmin edilir. Fire-PDF, tüm Firecrawl kullanıcıları için yapılandırma gerekmeden otomatik olarak etkin hale getirilmiştir. (Kaynak: BlockBeats)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.