Seguridad

PromptShield protege apps de IA con capas de detección que actúan en el camino crítico (request → LLM → response). Esta página describe qué hace cada capa y qué garantías de datos ofrecemos.

Capas de detección

  • L1 · Patterns.Regex offline contra ataques conocidos en español e inglés. Latencia < 5 ms, costo cero. Detecta inyecciones explícitas, intentos de role-play y comandos de extracción.
  • L1.5 · Document scan. Extrae texto de PDF/DOCX/XLSX/imágenes y lo evalúa para detectar inyección indirecta plantada en archivos.
  • L2 · AI Classifier. Claude Haiku 4.5 (fallback GPT-4o-mini) clasifica el mensaje en una de 9 categorías. Caché de respuestas para reducir costo y latencia.
  • L5 · Output validation. Revisa la respuesta del LLM antes de devolverla al usuario para detectar fugas de credenciales, instrucciones embebidas y violaciones de policy.

Modo zero-retention

Activa el toggle zero-retention en Settings de cada proyecto para que PromptShield no persista el contenido de los mensajes (solo metadata de uso). Útil para clientes con requisitos estrictos de privacidad.

Si zero-retention está apagado, el periodo de retención por defecto es 30 días, configurable a 7, 90 o 365 días.

Encripción y red

  • TLS 1.2+ en tránsito (Railway + Vercel managed certs).
  • Encripción at rest AES-256 (Supabase Postgres).
  • API keys almacenadas como hash SHA-256 + prefix visible (8 chars).
  • Webhooks firmados con HMAC-SHA256 estilo Stripe.

Compliance

Reportar vulnerabilidades

Manda detalles a security@sociedadia.com. Respondemos en menos de 48 horas hábiles.