Seguridad

PromptShield protege apps de IA con capas de detección que actúan en el camino crítico (request → LLM → response). Esta página describe qué hace cada capa y qué garantías de datos ofrecemos.

Capas de detección

L1 · Patterns.Regex offline contra ataques conocidos en español e inglés. Latencia < 5 ms, costo cero. Detecta inyecciones explícitas, intentos de role-play y comandos de extracción.
L1.5 · Document scan. Extrae texto de PDF/DOCX/XLSX/imágenes y lo evalúa para detectar inyección indirecta plantada en archivos.
L2 · AI Classifier. Claude Haiku 4.5 (fallback GPT-4o-mini) clasifica el mensaje en una de 9 categorías. Caché de respuestas para reducir costo y latencia.
L5 · Output validation. Revisa la respuesta del LLM antes de devolverla al usuario para detectar fugas de credenciales, instrucciones embebidas y violaciones de policy.

Modo zero-retention

Activa el toggle zero-retention en Settings de cada proyecto para que PromptShield no persista el contenido de los mensajes (solo metadata de uso). Útil para clientes con requisitos estrictos de privacidad.

Si zero-retention está apagado, el periodo de retención por defecto es 30 días, configurable a 7, 90 o 365 días.

Encripción y red

TLS 1.2+ en tránsito (Railway + Vercel managed certs).
Encripción at rest AES-256 (Supabase Postgres).
API keys almacenadas como hash SHA-256 + prefix visible (8 chars).
Webhooks firmados con HMAC-SHA256 estilo Stripe.

Compliance

LFPDPPP (México): aviso de privacidad, derechos ARCO.
ISO 42001 (AI): audit log inmutable de llamadas a clasificadores LLM.
DPA disponible — ver plantilla.
SOC 2 Type II e ISO 27001 en preparación.

Reportar vulnerabilidades

Manda detalles a security@sociedadia.com. Respondemos en menos de 48 horas hábiles.