Documentación: Nodo Analizar Imagen con IA (Analyze Image with AI)¶

Descripción General¶

El Nodo Analizar Imagen con IA (Analyze Image with AI) es un nodo de acción universal para el análisis de imágenes con inteligencia artificial. A diferencia de los nodos específicos de cada proveedor (GPT, Claude, Gemini, etc.), este nodo permite elegir entre múltiples modelos y proveedores desde un único punto, usando un selector de modelos con búsqueda (estilo OpenRouter), y ofrece controles avanzados como temperatura, máximo de tokens y un esquema de salida estructurada (JSON).

En entornos IoT y de seguridad, es la opción más flexible para analizar imágenes de cámaras con IA, permitiendo cambiar de modelo sin cambiar de nodo y forzar salidas estructuradas para integrarlas fácilmente en la lógica del flujo.

¿Cuándo usar este nodo?¶

Utiliza este nodo cuando necesites:

Analizar imágenes con IA pudiendo elegir el modelo/proveedor de forma flexible.
Obtener una salida estructurada (JSON) definida por un esquema, para procesarla en nodos posteriores.
Ajustar parámetros avanzados (temperatura, máximo de tokens) según el caso.
Centralizar el análisis de imágenes sin atarte a un único proveedor.

Configuración del Nodo¶

El formulario se organiza en tres secciones seleccionables: Model, Prompt y Advanced. Además, dispone de la pestaña JSON Editor.

Sección Model del nodo Analizar imagen con IA

Sección: Model¶

1. API Key *Requerido¶

La clave de API del proveedor (campo protegido). Una vez ingresada, habilita el navegador de modelos.

2. Modelo (Model) *Requerido¶

Un selector de modelos con búsqueda (Select a model...) que permite explorar los modelos disponibles por nombre o proveedor. Cada modelo se identifica con un ID del tipo proveedor/modelo (por ejemplo, openai/gpt-4o).

Sección: Prompt¶

3. URLs de Imágenes (Image URLs) *Requerido¶

Lista de URLs de las imágenes a analizar. Admite variables de automatización como {{get_snapshot_node.url}}.

4. System Prompt *Opcional¶

Instrucciones de sistema para el modelo (define el rol/comportamiento, por ejemplo, "You are a security analyst. Respond concisely.").

5. Prompt *Requerido¶

La instrucción o pregunta concreta sobre la imagen.

Sección Prompt del nodo Analizar imagen con IA

Sección: Advanced¶

Temperature: Controla la creatividad/aleatoriedad de la respuesta (0 a 2; por defecto ~0.7).
Max Tokens: Límite máximo de tokens de la respuesta.
Output Schema (JSON): Define un esquema JSON para forzar una salida estructurada, ideal para procesar el resultado de forma programática.

Sección Advanced del nodo Analizar imagen con IA

Vista Editor de JSON¶

Vista JSON Editor del nodo Analizar imagen con IA

Estructura JSON (Parámetros de entrada)¶

{
  "api_key": "sk-or-xxxxxxxxxxxxxxxx",
  "model_id": "openai/gpt-4o",
  "image_urls": [
    "{{get_snapshot_node.url}}"
  ],
  "prompt": "Are there people or vehicles in this image? Indicate how many and their approximate location.",
  "system_prompt": "You are a security analyst. Respond concisely."
}

Campos del JSON¶

Campo	Tipo	Descripción
`api_key`	string	Clave de API del proveedor.
`model_id`	string	ID del modelo (`proveedor/modelo`, ej. `openai/gpt-4o`).
`image_urls`	array (string)	URLs de las imágenes a analizar.
`prompt`	string	La instrucción/pregunta sobre la imagen.
`system_prompt`	string	(Opcional) Instrucciones de sistema.
`temperature`	number	(Opcional, Advanced) Creatividad de la respuesta (0–2).
`max_tokens`	number	(Opcional, Advanced) Límite de tokens de la respuesta.
`output_schema`	object	(Opcional, Advanced) Esquema JSON para forzar salida estructurada.

Output: Dónde viene la data del nodo¶

El resultado del análisis queda disponible en la salida del nodo y puede usarse en nodos posteriores con {{node_key}}. Si se definió un Output Schema, la salida respetará esa estructura JSON, facilitando su uso en condiciones y otras acciones.

Ejemplos de uso¶

Ejemplo 1: Verificación de alarma con salida estructurada¶

Caso de uso: Analizar la captura de una cámara y obtener un JSON con { personas: n, vehiculos: n, sospechoso: bool } para decidir si escalar la alarma.

Model: openai/gpt-4o (u otro a elección)
Image URLs: {{get_snapshot_node.url}}
System Prompt: You are a security analyst. Respond concisely.
Prompt: Are there people or vehicles in this image? Indicate how many and their approximate location.
Output Schema: un esquema JSON con los campos deseados.

(ver estructura JSON anterior)

Validación y errores¶

Condición	Causa / Solución habitual
No se pueden explorar modelos	Ingresa primero una API Key válida para habilitar el navegador de modelos.
Error de autenticación	La API Key es inválida o sin saldo/permisos para el modelo elegido.
Las URLs no funcionan	Asegúrate de que las URLs de imagen sean accesibles públicamente.
La salida no es JSON	Define un Output Schema y/o indica en el prompt que responda en JSON.

Buenas prácticas¶

Forzar salida estructurada: Usa Output Schema cuando vayas a procesar el resultado en condiciones o acciones posteriores.
Elegir el modelo según el caso: Modelos potentes para análisis complejos; más ligeros para tareas simples y menor costo.
System Prompt claro: Define el rol del modelo para obtener respuestas consistentes.
Encadenar con la captura: Patrón típico: Obtener captura → Analizar imagen con IA → condición/notificación.