Blockify reescribe el RAG empresarial: usa IdeaBlock en lugar de Chunking, comprime 40 veces y reduce los tokens 3 veces

La nueva herramienta de optimización de datos empresariales de IA, Blockify, fue promocionada y organizada por akshay_pachaar el 9 de mayo. Afirma que en el flujo de RAG (Retrieval-Augmented Generation) puede comprimir la base de datos de la empresa 40 veces, reducir el uso de tokens de consulta 3 veces y aumentar en 2,3 veces la precisión de la búsqueda vectorial. En la descripción oficial de GitHub de Blockify se indica que el producto fue desarrollado por Iternal Technologies, que utiliza unidades de conocimiento estructurado con una estructura “IdeaBlock” para sustituir el chunking tradicional, y que mantiene la base de conocimiento concisa, coherente y gobernable mediante la desduplicación y la fusión por solapamiento.

Concepto central: usar IdeaBlock para sustituir el chunking tradicional

Diseño técnico de Blockify:

Enfoque tradicional: dividir documentos largos en chunk de tamaño fijo, incrustar vectores y obtener top-k en la recuperación

Enfoque de Blockify: convertir el contenido original en IdeaBlock: unidades de conocimiento estructurado con XML

Cada IdeaBlock incluye: pregunta incluida, respuesta confiable, tags, entidades y palabras clave

Los IdeaBlock similares se desduplican y fusionan automáticamente; la base de conocimiento no se infla a medida que crece el contenido

El problema del chunking tradicional es que la misma información puede aparecer repetida en múltiples chunks, generando redundancia en la recuperación y desperdicio de tokens; IdeaBlock incrementa la densidad de información mediante la desduplicación, expresando el mismo contenido con un espacio de almacenamiento más pequeño.

Beneficios concretos: comprimir 40 veces, reducir tokens 3 veces y aumentar la precisión 2,3 veces

Métricas de beneficios concretas publicadas por Blockify:

Compresión de datos: la base de datos de la empresa se reduce a aproximadamente 2,5% del tamaño original (40 veces de compresión), conservando 99% o más de la información

Tokens por consulta: de unos 303 (chunk tradicional) a unos 98 (IdeaBlock)—eficiencia 3,09 veces

Precisión de la búsqueda vectorial: mejora 2,29 veces

Mejora global de la precisión: aproximadamente 78 veces (efecto combinado integral, incluida la desduplicación y las mejoras en la recuperación)

Estimación de ahorro de costos: 100 millones de consultas/año; el costo de tokens ahorrado es de aproximadamente 73,8 mil dólares

La mejora global de la precisión 78 veces es un efecto combinado: la desduplicación reduce el ruido, el contenido estructurado de IdeaBlock resulta más favorable para la búsqueda vectorial, y la disminución de tokens en cada respuesta reduce también el margen de error del modelo.

Alcance de la integración: LlamaIndex, LangChain, Milvus, Cloudflare y otros marcos populares

Herramientas de desarrolladores e infraestructura que Blockify ya integra:

Marco RAG: LlamaIndex, LangChain

Gestión del conocimiento: Obsidian

Base de datos vectorial: Milvus, Elastic, Supabase

Computación en el borde: Cloudflare

Integración low-code: n8n (mediante plantillas de flujos de trabajo)

La estrategia de integración de Blockify es “no reemplazar los marcos RAG existentes, sino actuar como una capa previa de optimización de datos”. Los desarrolladores pueden sustituir el paso de chunking original por Blockify dentro de flujos existentes de LlamaIndex o LangChain, manteniendo intacto el resto del proceso.

Eventos concretos que se pueden seguir en el futuro: el crecimiento del número de estrellas en el GitHub de Blockify y la adopción por parte de la comunidad, si Iternal Technologies solicitará o revelará detalles técnicos sobre la estructura de IdeaBlock (actualmente destaca “patented ingestion”), y si los marcos RAG populares incorporarán lógicas similares de desduplicación como función predeterminada.

Este artículo Blockify reescribe el RAG empresarial: usa IdeaBlock para reemplazar el chunking, comprime 40 veces y reduce tokens 3 veces, apareció por primera vez en Cadena de Noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Alibaba Cloud lanza un plan de tokens del equipo con 10+ modelos hoy

Según Beating, Alibaba Cloud lanzó hoy su Plan de Token del Equipo, ofreciendo suscripciones a 10+ modelos de lenguaje grande, incluidos Qwen 3.6, Kimi-K2.6, GLM-5.1 y Wan 2.7. Los usuarios pueden cambiar de forma flexible entre modelos para la generación de código, la síntesis de imágenes y otras tareas. La versión para equipos se diferencia de los planes personales mediante funciones de gestión empresarial. Los administradores pueden gestionar la asignación de plazas, hacer seguimiento del uso

GateNewshace2h

Dongguan enviará la mitad de las gafas de IA del mundo en 2025

Las empresas con sede en Dongguan enviaron más de 4 millones de pares de gafas de IA en 2025, lo que representa casi la mitad del total global de 8,7 millones de pares, según la firma de investigación Omdia. La ciudad china de Guangdong ocupó el primer lugar en el mundo por volumen de envíos, mientras que las remesas globales de gafas de IA aumentaron un 322% frente al año anterior. Posición de mercado de Dongguan y apoyo del gobierno El dominio de la ciudad en la fabricación de gafas de IA refl

CryptoFrontierhace4h

UXLINK integra la infraestructura de computación con IA de Origins Network para escalar en Web3

De acuerdo con el anuncio oficial de UXLINK del 11 de mayo, el protocolo social Web3 anunció una colaboración estratégica con Origins Network para integrar infraestructura de cómputo de IA descentralizada en su ecosistema. La asociación busca mejorar la plataforma de UXLINK incorporando la infraestructura modular de blockchain de Origins Network, impulsando las capacidades de cómputo para aplicaciones descentralizadas impulsadas por IA. La integración aprovechará el mecanismo de Proof-of-Computa

GateNewshace8h

Tencent Cloud impulsa el servicio bancario de IA de Ryt Bank para 50.000 usuarios el día de su lanzamiento

Según Tencent Cloud, el 11 de mayo, la empresa se asoció con el banco digital Ryt Bank, con sede en Malasia, para respaldar su servicio de banca conversacional impulsado por IA mediante Tencent Cloud Chat para mensajería en tiempo real. El sistema gestionó 50.000 usuarios activos el día de lanzamiento sin interrupciones, lo que permitió que los clientes dieran instrucciones de pago en lenguaje sencillo en lugar de navegar por los menús de la aplicación. Ryt Bank ha alcanzado 1,2 millones de usua

GateNewshace10h

Reactor lanza una demostración de modelo mundial en tiempo real y logra 7,8 millones de visitas

Según Beating, Reactor lanzó hoy su demostración de modelo de mundo en tiempo real, lo que permite a los usuarios generar escenas 3D interactivas mediante procesamiento de IA basado en la nube. El modelo se ejecuta en la infraestructura global de nube con baja latencia de la empresa, eliminando la necesidad de hardware local. En un video de demostración que incluye un auto deportivo rojo recorriendo un paisaje desértico alienígena, la IA representó en tiempo real la física del terreno y objetos

GateNewshace10h

Minara lanza hoy su primer asistente de IA tipo copiloto para mercados de predicción Hyperliquid HIP-4

Según BlockBeats, Minara AI lanzó hoy (11 de mayo) su AI Prediction Copilot, convirtiéndose en la primera herramienta de IA para mercados de predicción integrada con el mercado HIP-4 de Hyperliquid. El sistema analiza tendencias a corto plazo de BTC, niveles de soporte y resistencia, y discrepancias en el precio del mercado para ofrecer recomendaciones de trading con YES/NO. El Copilot muestra en tiempo real probabilidad de la IA, probabilidad implícita del mercado, valor del edge y rendimientos

GateNewshace11h
Comentar
0/400
Sin comentarios