Para uso interno · Documento compartido

Tus datos son tuyos. Así los protegemos.

Cada empresa pregunta lo mismo cuando ve IA por primera vez: "¿Qué pasa con nuestros datos?" Esta página explica las dos arquitecturas disponibles y el marco legal europeo que las envuelve.

Dos malentendidos frecuentes

Lo que no es cierto — y por qué.

Mito

"Si usamos IA, nuestros datos van a entrenar el modelo de otra empresa."

Depende del plan, no de si pagas o no. Los planes de consumo personal — ChatGPT Free, Plus y Pro; Gemini Personal; Claude Free y Pro — entrenan con tus datos por defecto. Los planes empresariales — ChatGPT Team y Enterprise, Google Workspace (Gemini for Workspace), Claude for Work / Teams — están excluidos del entrenamiento por defecto, por contrato. La pregunta correcta no es "¿usamos IA de pago?" sino "¿tenemos un plan Teams o Enterprise?"

Mito

"IA en la nube significa datos fuera de nuestro control."

Sólo si se configura así. Con un entorno de red privada virtual (VPC) y garantías contractuales de cero retención, la IA en la nube tiene el mismo nivel de aislamiento que un sistema on-premise — más las garantías de disponibilidad del proveedor.

Dos arquitecturas

¿Qué arquitectura encaja con ustedes?

No existe una única respuesta correcta. La decisión depende del perfil regulatorio de la empresa, la sensibilidad del dato, y la capacidad operativa interna. Normalmente llegamos a la respuesta juntos en la primera sesión de diseño.

Opción A
LLM en la nube con aislamiento privado
Azure OpenAI · AWS Bedrock · GCP Vertex AI
  • 1 API empresarial privada — no el ChatGPT público. La llamada va directamente a la instancia del proveedor reservada para clientes corporativos, sin pasar por la interfaz de consumo.
  • 2 Instancia en red privada virtual (VPC) — un entorno lógicamente aislado dentro de la infraestructura del proveedor. Los datos no conviven con los de otros clientes.
  • 3 Cero retención de datos — por contrato — el proveedor no almacena ni registra los prompts o respuestas tras la llamada. Nota: en Azure OpenAI, la retención cero no es el comportamiento por defecto. Por defecto, los prompts se retienen 30 días con monitoreo automatizado (incluyendo modelos de IA) — la revisión humana ocurre solo sobre contenido marcado por el sistema, no de forma rutinaria. La retención cero requiere un Acuerdo Empresarial (EA/MCA) y una solicitud formal aprobada por Microsoft. Gestionamos este proceso con el cliente durante la implementación.
  • 4 Túnel cifrado de extremo a extremo — los datos viajan cifrados entre vuestros servidores y el entorno del proveedor. No tocan la internet pública.
Opción B
LLM de código abierto — local o en vuestro cloud
Desplegado en vuestra infraestructura
  • 1 Modelo de pesos abiertos — el modelo se descarga una vez y se aloja en vuestra infraestructura. Nunca se envía nada a un tercero.
  • 2 Self-host en vuestro entorno — vuestros servidores, vuestra suscripción cloud privada, o red aislada. Los datos permanecen dentro de vuestro perímetro de red y tenant.
  • 3 Soberanía total del dato — los datos no cruzan ninguna frontera organizacional. No hay sub-procesadores, no hay DPA que negociar con terceros.
  • 4 Trade-off operativo — vosotros operáis el modelo. Brecha de rendimiento real frente a modelos frontier cerrados. Máximo control, mayor carga de infraestructura.
Recomendado para empresas reguladas en la UE
Phi-4/mini (Microsoft, MIT) · Gemma 4 (Google, Apache 2.0) · Command A+ (Cohere, Apache 2.0) · OLMo 3 (Allen Institute, Apache 2.0)
Alternativa soberana europea
EuroLLM-22B (consorcio UE, multilingual IT/ES) · Salamandra (BSC España, Apache 2.0) · Pleias (Francia, RAG sobre corpus licenciados)
No recomendado para empresas reguladas en la UE
DeepSeek (el Garante italiano impuso una limitación definitiva del tratamiento de datos en enero 2025 — investigación en curso) · Qwen / Kimi / Yi (origen chino — sujetos a la Ley de Inteligencia Nacional; posición regulatoria no resuelta en la UE). No porque los modelos sean malos — sino porque la cadena de suministro no es auditable ante vuestro departamento legal.
Opción A — Cloud privado Opción B — Open-source local
Rendimiento Modelos frontier (GPT-4o, Claude, Gemini). Máxima capacidad. Brecha real frente a frontier. Cierra a medida que los modelos open-source maduran.
Soberanía del dato Alta — VPC + cero retención contractual. Datos fuera de vuestros servidores sólo durante el procesamiento. Total — los datos no salen de vuestro perímetro en ningún momento.
Costo operativo Pago por uso. Sin infraestructura GPU propia. Escala con el volumen. Inversión inicial en hardware/cloud + equipo técnico para mantener el modelo.
Cuándo elegirlo Empresa sin mandato de soberanía total, que prioriza capacidad y velocidad de despliegue. Empresa con mandato explícito de datos en casa, sector muy regulado, o datos altamente sensibles.
Marco legal europeo

GDPR — La capa que envuelve ambas arquitecturas

Independientemente de la arquitectura elegida, si la empresa opera en la UE, el RGPD aplica. No es una opción. Esta sección describe las cuatro obligaciones concretas que gestionamos en cada implementación.

01

Residencia de datos en la UE

Todos los datos se procesan y almacenan en regiones de la UE. Para Opción A, esto se configura explícitamente en el contrato con el proveedor (Azure, AWS, GCP tienen regiones EU con garantías de residencia). Para Opción B, el servidor es vuestro — la región es vuestra decisión.

02

Acuerdo de procesador y sub-procesadores

El Art. 28 RGPD exige un contrato escrito entre vosotros (responsable) y nosotros/el proveedor (encargado). Este DPA define qué datos, para qué fin, durante cuánto tiempo, y con qué medidas de seguridad. Para Opción A, el proveedor cloud firma adicionalmente un DPA con vosotros. Todos los sub-procesadores deben divulgarse y pueden ser auditados.

03

Accesos desde fuera de la UE

Cualquier acceso desde un país fuera de la lista de adecuación de la UE requiere medidas adicionales — sin importar la nacionalidad del acceso o su ubicación física. Las salvaguardas técnicas y contractuales que implementamos:

  • Cláusulas Contractuales Estándar (SCCs) firmadas con cualquier sub-procesador fuera de la UE
  • VPN + reglas de red (NSG) que limitan el acceso al servidor a IPs conocidas
  • MFA obligatorio en todos los accesos de administración
  • Bitácora de accesos: quién, qué, cuándo, desde dónde
04

Pista de auditoría y trazabilidad

Todos los inputs y outputs del modelo se registran con timestamps. La política de retención es configurable — podéis exigir borrado en X días. Si un interesado ejerce su derecho de supresión (Art. 17), el registro permite localizar y eliminar sus datos de forma demostrable. El log de auditoría es también el primer instrumento en caso de incidente de seguridad.

NIS2 — Cuando un fallo de IA se convierte en incidente reportable

+50 empleados
·
+€10M de facturación
·
sectores cubiertos (manufactura industrial específica, salud, infraestructura digital)

Si vuestra empresa supera estos umbrales y opera en sectores cubiertos — NIS2 distingue entre Entidades Esenciales (Anexo I: energía, salud, infraestructura digital) y Entidades Importantes (Anexo II: manufactura industrial específica — dispositivos médicos, maquinaria, equipos electrónicos; no toda manufactura está cubierta). La Directiva está en vigor en toda la UE desde octubre 2024 y obliga a mantener un registro de riesgos de seguridad de la información y a notificar incidentes significativos en 24h (notificación inicial) y 72h (informe completo). Los despliegues de IA deben catalogarse en ese registro; un fallo del modelo que afecte a un proceso crítico se convierte en un incidente reportable. Lo gestionamos como parte del diseño de la arquitectura desde el primer día.

En vigor agosto 2, 2026

EU AI Act — Art. 50: El usuario debe saber que habla con una IA

A partir del 2 de agosto de 2026, cualquier sistema de IA diseñado para interacción directa con personas — chatbots, copilots, asistentes — debe informar al usuario de que está interactuando con una IA. La obligación recae sobre el desplegador (vosotros), no sobre el proveedor del modelo.

En la práctica: es un requisito de UX que integramos en el diseño de cada interfaz. Un banner de aviso, un mensaje de bienvenida, o una etiqueta clara. No es una amenaza regulatoria — es una línea de código que añadimos desde el principio.

Nuestro proceso

Cómo decidimos juntos

1

Clasificamos la sensibilidad de vuestros datos

No todos los datos tienen el mismo nivel de sensibilidad. Mapeamos qué flujos procesan datos personales, comercialmente sensibles, o regulados — y cuáles no. La arquitectura sigue a la clasificación, no al revés.

2

Mapeamos la arquitectura correcta por flujo

No hay una única respuesta para toda la empresa. Un flujo de cotización puede ir por Opción A; un flujo que toca datos de pacientes puede requerir Opción B. El modelo híbrido por flujo es la norma, no la excepción.

3

Documentamos la capa contractual y operativa

DPAs, catálogo de sub-procesadores, política de retención, bitácora de auditoría — todo queda documentado antes de ir a producción. No es un trámite: es la evidencia que vuestro departamento legal y cualquier auditor necesitan.