企業 IA資料優化新工具 Blockify 5 月 9 日由 akshay_pachaar 整理推廣,宣稱在 RAG(Retrieval-Augmented Generation)流程中可压縮 40 倍企業資料庫、查詢 token 用量減 3 倍、向量搜尋準確率提升 2,3 倍。Blockify 官方 GitHub 說明:產品由 Iternal Technologies 推出,用「IdeaBlock」結構化知識單元取代傳統 chunking,並透過去重合併讓知識庫保持精簡、連貫、可治理。
核心概念:用 IdeaBlock 取代傳統 chunking
Blockify 的技術設計:
傳統做法:把長文件切成固定大小的 chunk、嵌入向量、檢索時取 top-k
Blockify 做法:把原始內容轉換為 IdeaBlock—XML 結構化知識單元
每個 IdeaBlock 內含:自帶問題、可信答案、tag、實體、關鍵字
相似 IdeaBlock 自動去重合併、知識庫不會隨內容增長膨脹
傳統 chunking 的問題是同一資訊可能在多個 chunk 中重複出現,造成檢索冗餘與 token 浪費;IdeaBlock 透過去重把資訊密度提升,同樣內容用更小的儲存空間表達。
具體效益:壓縮 40 倍、token 減 3 倍、準確率升 2,3 倍
Blockify 公布的具體效益指標:
資料壓縮:企業資料庫縮減至原大小約 2,5%(40 倍壓縮)、保留 99% 以上資訊
每查詢 token:從約 303 個(傳統 chunk)降至約 98 個(IdeaBlock)—3,09 倍效率
向量檢索準確率:提升 2,29 倍
整體準確率改善:約 78 倍(含去重與檢索改進綜合效應)
成本節省試算:1 億查詢/年,節省 token 成本約 73,8 萬美元
78 倍的整體準確率提升是綜合效應—去重減少噪音、IdeaBlock 結構化內容對向量檢索友善、單次回答 token 數下降同時減少模型出錯空間。
整合範圍:LlamaIndex、LangChain、Milvus、Cloudflare 等主流框架
Blockify 已整合的開發者工具與基礎設施:
RAG 框架:LlamaIndex、LangChain
知識管理:Obsidian
向量資料庫:Milvus、Elastic、Supabase
邊緣運算:Cloudflare
低程式碼整合:n8n(透過工作流程模板)
Blockify 的整合策略是「不取代既有 RAG 框架,而是作為前置資料優化層」。開發者可在現有 LlamaIndex 或 LangChain 流程中,用 Blockify 替換原本的 chunking 步驟,其餘流程不變。
後續可追蹤的具體事件:Blockify GitHub 星數成長與社群採用率、Iternal Technologies 是否就 IdeaBlock 結構申請或揭露技術細節(目前標榜「patented ingestion」),以及主流 RAG 框架是否將類似去重邏輯內建為預設功能。
這篇文章 Blockify 改寫企業 RAG:用 IdeaBlock 取代 chunking、壓縮 40 倍、token 減 3 倍 最早出現於 鏈新聞 ABMedia。
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Alibaba Cloud lance un plan de jetons pour l’équipe avec plus de 10 modèles aujourd’hui
Beating indique qu’Alibaba Cloud a lancé aujourd’hui son plan Team Token, proposant des abonnements à 10+ grands modèles de langage, dont Qwen 3.6, Kimi-K2.6, GLM-5.1 et Wan 2.7. Les utilisateurs peuvent changer de modèle de manière flexible pour la génération de code, la synthèse d’images et d’autres tâches. La version équipe se distingue des offres personnelles par des fonctions de gestion destinées aux entreprises. Les administrateurs peuvent gérer l’attribution des sièges, suivre l’utilisati
GateNewsIl y a 4h
Dongguan expédie la moitié des lunettes IA mondiales en 2025
Des entreprises basées à Dongguan ont expédié plus de 4 millions de paires de lunettes intelligentes d’IA en 2025, représentant près de la moitié du total mondial de 8,7 millions de paires, d’après la société d’études Omdia. La ville du Guangdong s’est classée première au monde par volume d’expédition, tandis que les livraisons mondiales de lunettes d’IA ont progressé de 322% par rapport à l’année précédente. La position de Dongguan sur le marché et le soutien des autorités publiques La dominati
CryptoFrontierIl y a 7h
UXLINK intègre l’infrastructure de calcul d’IA d’Origins Network pour le passage à l’échelle de Web3
D’après l’annonce officielle d’UXLINK du 11 mai, le protocole social Web3 a annoncé une collaboration stratégique avec Origins Network afin d’intégrer une infrastructure décentralisée de calcul pour l’IA dans son écosystème. Le partenariat vise à améliorer la plateforme d’UXLINK en y intégrant l’infrastructure modulaire de blockchain d’Origins Network, afin de renforcer les capacités de calcul pour les applications décentralisées pilotées par l’IA. L’intégration tirera parti du mécanisme Proof-o
GateNewsIl y a 11h
Tencent Cloud alimente le service bancaire IA de Ryt Bank pour 50 000 utilisateurs le jour du lancement
Selon Tencent Cloud, le 11 mai, l’entreprise s’est associée à la banque numérique malaisienne Ryt Bank pour soutenir son service bancaire conversationnel, propulsé par l’IA, grâce à Tencent Cloud Chat pour la messagerie en temps réel. Le système a pris en charge 50 000 utilisateurs actifs le jour du lancement, sans interruption, permettant aux clients de donner des instructions de paiement en langage clair au lieu de naviguer dans les menus de l’application. Ryt Bank a atteint 1,2 million d’util
GateNewsIl y a 12h
Reactor lance une démo de modèle de monde en temps réel, totalisant 7,8 millions de vues
Beating, Reactor a lancé aujourd’hui sa démo de modèle mondial en temps réel, permettant aux utilisateurs de générer des scènes 3D interactives grâce à un traitement IA basé sur le cloud. Le modèle s’exécute sur l’infrastructure cloud mondiale à faible latence de l’entreprise, éliminant ainsi le besoin de matériel local. Dans une vidéo de démonstration mettant en scène une voiture de sport rouge traversant un paysage désertique extraterrestre, l’IA a rendu en temps réel la physique du terrain et
GateNewsIl y a 13h
Minara lance aujourd’hui son premier assistant IA Copilot de marché de prédictions Hyperliquid HIP-4
Selon BlockBeats, Minara AI a lancé aujourd’hui (11 mai) AI Prediction Copilot, devenant le premier outil d’IA pour les marchés de prédiction intégré au marché HIP-4 de Hyperliquid. Le système analyse les tendances à court terme de BTC, les niveaux de support et de résistance, ainsi que les écarts de prix du marché afin de fournir des recommandations de trading YES/NO. Le Copilot affiche en temps réel la probabilité issue de l’IA, la probabilité implicite du marché, la valeur de l’edge et les re
GateNewsIl y a 13h