Documentación

PromptShield es middleware de seguridad para apps de IA. Bloquea inyección de prompts, jailbreaks, ingeniería social y ataques basados en documentos antes de que lleguen a tu LLM, y valida la respuesta antes de devolverla al usuario.

Quickstart en 3 pasos

1. Crea una API key

Entra al dashboard, crea un proyecto y genera una API key (formato ps_live_… o ps_test_…).

2. Instala el SDK

pnpm add @aisociety/promptshield

3. Verifica el input antes de tu LLM

import { PromptShield } from '@aisociety/promptshield';

const ps = new PromptShield({ apiKey: process.env.PROMPTSHIELD_API_KEY! });

const result = await ps.check({ message: userInput });
if (!result.safe) {
  return { error: 'blocked', reason: result.reason };
}
// safe — manda al LLM

Capas de detección

CapaQué haceLatencia
L1 · PatternsRegex contra ataques conocidos (ES + EN)<5ms
L1.5 · DocumentsInyección indirecta en PDF/DOCX/XLSX/imágenes50–500ms
L2 · AI ClassifierClaude Haiku / GPT-4o-mini para ataques sutiles200–400ms
L5 · OutputValidación post-LLM antes de responder al usuario<5ms

Siguientes pasos