Saltar a contenido

Documentación: Nodo Vector Store RAG

Descripción General

El Nodo Vector Store RAG es un nodo de la familia de AI Models que permite insertar documentos en un almacén vectorial (vector store) para habilitar RAG (Generación Aumentada por Recuperación / Retrieval Augmented Generation). Convierte el contenido de una fuente (un documento, texto o URL) en embeddings vectoriales que luego un Agente puede recuperar para responder preguntas con conocimiento específico.

En entornos IoT e industriales, es ideal para dar a un Agente conocimiento del dominio: manuales de operación, procedimientos de seguridad, fichas técnicas de equipos, etc., de modo que el asistente responda con información precisa de tu organización.


¿Cuándo usar este nodo?

Utiliza este nodo cuando necesites:

  • Cargar documentos (manuales, procedimientos, fichas técnicas) en un almacén vectorial.
  • Dar a un Agente conocimiento específico del dominio para responder con precisión (RAG).
  • Indexar contenido para búsquedas semánticas posteriores.

Arquitectura: conectar Embedding, Loader y Base de Datos

Este nodo trabaja junto con otros nodos que se le conectan en el lienzo a través de sus conectores: Embedding (modelo de embeddings), Loader (cargador de documentos) y DB (base de datos vectorial, por ejemplo Redis Vector DB).


Configuración del Nodo

El nodo cuenta con dos pestañas de configuración: Formulario (Form) y Editor de JSON (JSON Editor).

Configuración vacía del nodo Vector Store RAG

Vista Formulario

1. Modo (Mode)

La operación a realizar. Disponible: Insert (insertar documentos en el almacén).

2. Clave de Memoria (Memory Key)

Identificador del almacén vectorial donde se guardarán los documentos (por ejemplo, plant_manuals). Permite agrupar y luego recuperar el conocimiento.

3. Fuente (Source)

El contenido a indexar. Acepta una URL, contenido en base64 o texto plano (por ejemplo, la URL de un manual de operación).

4. Tamaño de Lote de Embeddings (Embedding Batch Size)

Número de fragmentos que se procesan por lote al generar los embeddings (por defecto 100).

5. Limpiar Almacén (Clear Store)

Interruptor que, al activarse, vacía el almacén antes de insertar (útil para reindexar desde cero).

Formulario configurado del nodo Vector Store RAG


Vista Editor de JSON

Vista JSON Editor del nodo Vector Store RAG


Estructura JSON (Parámetros de entrada)

{
  "mode": "insert",
  "memoryKey": "plant_manuals",
  "source": "https://demo02.netsocs.com/docs/plant_operation_manual.pdf",
  "embeddingBatchSize": 100,
  "clearStore": false
}

Campos del JSON

Campo Tipo Descripción
mode string Operación (insert).
memoryKey string Identificador del almacén vectorial.
source string Contenido a indexar (URL, base64 o texto plano).
embeddingBatchSize number Tamaño de lote para generar embeddings (por defecto 100).
clearStore boolean Si es true, vacía el almacén antes de insertar.

Output: Dónde viene la data del nodo

Al ejecutarse correctamente, el contenido queda indexado en el almacén vectorial bajo la memoryKey indicada, disponible para que un Agente lo recupere. El nodo confirma la operación al finalizar (borde verde).


Ejemplos de uso

Ejemplo 1: Indexar el manual de operación de la planta

Caso de uso: Cargar el manual de operación para que un Agente pueda responder preguntas de los operadores con base en él.

  • Mode: insert
  • Memory Key: plant_manuals
  • Source: URL del manual (PDF).

(ver estructura JSON anterior)

Ejemplo 2: Reindexar procedimientos de seguridad

Caso de uso: Actualizar los procedimientos cargados, limpiando el almacén previo.

  • Clear Store: activado.

Validación y errores

Condición Causa / Solución habitual
No se indexa el contenido Verifica que la source sea accesible (URL pública) o que el texto/base64 sea válido.
Falta el modelo de embeddings Conecta un nodo de Embedding al conector correspondiente.
Falta la base de datos Conecta una base de datos vectorial (ej. Redis Vector DB) al conector DB.

Buenas prácticas

  • Usar claves de memoria descriptivas: Agrupa el conocimiento por temas (plant_manuals, safety_procedures).
  • Conectar embedding y DB: Este nodo requiere un modelo de embeddings y una base de datos vectorial conectados.
  • Reindexar con cuidado: Usa Clear Store solo cuando quieras reemplazar todo el contenido del almacén.
  • Encadenar con un Agente: El valor del RAG aparece cuando un Agente recupera este conocimiento para responder.