Seguridad
PromptShield protege apps de IA con capas de detección que actúan en el camino crítico (request → LLM → response). Esta página describe qué hace cada capa y qué garantías de datos ofrecemos.
Capas de detección
- L1 · Patterns.Regex offline contra ataques conocidos en español e inglés. Latencia < 5 ms, costo cero. Detecta inyecciones explícitas, intentos de role-play y comandos de extracción.
- L1.5 · Document scan. Extrae texto de PDF/DOCX/XLSX/imágenes y lo evalúa para detectar inyección indirecta plantada en archivos.
- L2 · AI Classifier. Claude Haiku 4.5 (fallback GPT-4o-mini) clasifica el mensaje en una de 9 categorías. Caché de respuestas para reducir costo y latencia.
- L5 · Output validation. Revisa la respuesta del LLM antes de devolverla al usuario para detectar fugas de credenciales, instrucciones embebidas y violaciones de policy.
Modo zero-retention
Activa el toggle zero-retention en Settings de cada proyecto para que PromptShield no persista el contenido de los mensajes (solo metadata de uso). Útil para clientes con requisitos estrictos de privacidad.
Si zero-retention está apagado, el periodo de retención por defecto es 30 días, configurable a 7, 90 o 365 días.
Encripción y red
- TLS 1.2+ en tránsito (Railway + Vercel managed certs).
- Encripción at rest AES-256 (Supabase Postgres).
- API keys almacenadas como hash SHA-256 + prefix visible (8 chars).
- Webhooks firmados con HMAC-SHA256 estilo Stripe.
Compliance
- LFPDPPP (México): aviso de privacidad, derechos ARCO.
- ISO 42001 (AI): audit log inmutable de llamadas a clasificadores LLM.
- DPA disponible — ver plantilla.
- SOC 2 Type II e ISO 27001 en preparación.
Reportar vulnerabilidades
Manda detalles a security@sociedadia.com. Respondemos en menos de 48 horas hábiles.