Tus datos son tuyos

Dos malentendidos frecuentes

Lo que no es cierto — y por qué.

Mito

"Si usamos IA, nuestros datos van a entrenar el modelo de otra empresa."

Depende del plan, no de si pagas o no. Los planes de consumo personal — ChatGPT Free, Plus y Pro; Gemini Personal; Claude Free y Pro — entrenan con tus datos por defecto. Los planes empresariales — ChatGPT Team y Enterprise, Google Workspace (Gemini for Workspace), Claude for Work / Teams — están excluidos del entrenamiento por defecto, por contrato. La pregunta correcta no es "¿usamos IA de pago?" sino "¿tenemos un plan Teams o Enterprise?"

Mito

"IA en la nube significa datos fuera de nuestro control."

Sólo si se configura así. Con un entorno de red privada virtual (VPC) y garantías contractuales de cero retención, la IA en la nube tiene el mismo nivel de aislamiento que un sistema on-premise — más las garantías de disponibilidad del proveedor.

Dos arquitecturas

¿Qué arquitectura encaja con ustedes?

No existe una única respuesta correcta. La decisión depende del perfil regulatorio de la empresa, la sensibilidad del dato, y la capacidad operativa interna. Normalmente llegamos a la respuesta juntos en la primera sesión de diseño.

Opción A

LLM en la nube con aislamiento privado

Azure OpenAI · AWS Bedrock · GCP Vertex AI

1 API empresarial privada — no el ChatGPT público. La llamada va directamente a la instancia del proveedor reservada para clientes corporativos, sin pasar por la interfaz de consumo.
2 Instancia en red privada virtual (VPC) — un entorno lógicamente aislado dentro de la infraestructura del proveedor. Los datos no conviven con los de otros clientes.
3 Cero retención de datos — por contrato — el proveedor no almacena ni registra los prompts o respuestas tras la llamada. Nota: en Azure OpenAI, la retención cero no es el comportamiento por defecto. Por defecto, los prompts se retienen 30 días con monitoreo automatizado (incluyendo modelos de IA) — la revisión humana ocurre solo sobre contenido marcado por el sistema, no de forma rutinaria. La retención cero requiere un Acuerdo Empresarial (EA/MCA) y una solicitud formal aprobada por Microsoft. Gestionamos este proceso con el cliente durante la implementación.
4 Túnel cifrado de extremo a extremo — los datos viajan cifrados entre vuestros servidores y el entorno del proveedor. No tocan la internet pública.

Opción B

LLM de código abierto — local o en vuestro cloud

Desplegado en vuestra infraestructura

1 Modelo de pesos abiertos — el modelo se descarga una vez y se aloja en vuestra infraestructura. Nunca se envía nada a un tercero.
2 Self-host en vuestro entorno — vuestros servidores, vuestra suscripción cloud privada, o red aislada. Los datos permanecen dentro de vuestro perímetro de red y tenant.
3 Soberanía total del dato — los datos no cruzan ninguna frontera organizacional. No hay sub-procesadores, no hay DPA que negociar con terceros.
4 Trade-off operativo — vosotros operáis el modelo. Brecha de rendimiento real frente a modelos frontier cerrados. Máximo control, mayor carga de infraestructura.

Recomendado para empresas reguladas en la UE

Phi-4/mini (Microsoft, MIT) · Gemma 4 (Google, Apache 2.0) · Command A+ (Cohere, Apache 2.0) · OLMo 3 (Allen Institute, Apache 2.0)

Alternativa soberana europea

EuroLLM-22B (consorcio UE, multilingual IT/ES) · Salamandra (BSC España, Apache 2.0) · Pleias (Francia, RAG sobre corpus licenciados)

No recomendado para empresas reguladas en la UE

DeepSeek (el Garante italiano impuso una limitación definitiva del tratamiento de datos en enero 2025 — investigación en curso) · Qwen / Kimi / Yi (origen chino — sujetos a la Ley de Inteligencia Nacional; posición regulatoria no resuelta en la UE). No porque los modelos sean malos — sino porque la cadena de suministro no es auditable ante vuestro departamento legal.

	Opción A — Cloud privado	Opción B — Open-source local
Rendimiento	Modelos frontier (GPT-4o, Claude, Gemini). Máxima capacidad.	Brecha real frente a frontier. Cierra a medida que los modelos open-source maduran.
Soberanía del dato	Alta — VPC + cero retención contractual. Datos fuera de vuestros servidores sólo durante el procesamiento.	Total — los datos no salen de vuestro perímetro en ningún momento.
Costo operativo	Pago por uso. Sin infraestructura GPU propia. Escala con el volumen.	Inversión inicial en hardware/cloud + equipo técnico para mantener el modelo.
Cuándo elegirlo	Empresa sin mandato de soberanía total, que prioriza capacidad y velocidad de despliegue.	Empresa con mandato explícito de datos en casa, sector muy regulado, o datos altamente sensibles.

Marco legal europeo

GDPR — La capa que envuelve ambas arquitecturas

NIS2 — Cuando un fallo de IA se convierte en incidente reportable

+50 empleados

+€10M de facturación

sectores cubiertos (manufactura industrial específica, salud, infraestructura digital)

Si vuestra empresa supera estos umbrales y opera en sectores cubiertos — NIS2 distingue entre Entidades Esenciales (Anexo I: energía, salud, infraestructura digital) y Entidades Importantes (Anexo II: manufactura industrial específica — dispositivos médicos, maquinaria, equipos electrónicos; no toda manufactura está cubierta). La Directiva está en vigor en toda la UE desde octubre 2024 y obliga a mantener un registro de riesgos de seguridad de la información y a notificar incidentes significativos en 24h (notificación inicial) y 72h (informe completo). Los despliegues de IA deben catalogarse en ese registro; un fallo del modelo que afecte a un proceso crítico se convierte en un incidente reportable. Lo gestionamos como parte del diseño de la arquitectura desde el primer día.

En vigor agosto 2, 2026

EU AI Act — Art. 50: El usuario debe saber que habla con una IA

A partir del 2 de agosto de 2026, cualquier sistema de IA diseñado para interacción directa con personas — chatbots, copilots, asistentes — debe informar al usuario de que está interactuando con una IA. La obligación recae sobre el desplegador (vosotros), no sobre el proveedor del modelo.

En la práctica: es un requisito de UX que integramos en el diseño de cada interfaz. Un banner de aviso, un mensaje de bienvenida, o una etiqueta clara. No es una amenaza regulatoria — es una línea de código que añadimos desde el principio.

Nuestro proceso

Cómo decidimos juntos

Clasificamos la sensibilidad de vuestros datos

No todos los datos tienen el mismo nivel de sensibilidad. Mapeamos qué flujos procesan datos personales, comercialmente sensibles, o regulados — y cuáles no. La arquitectura sigue a la clasificación, no al revés.

Mapeamos la arquitectura correcta por flujo

No hay una única respuesta para toda la empresa. Un flujo de cotización puede ir por Opción A; un flujo que toca datos de pacientes puede requerir Opción B. El modelo híbrido por flujo es la norma, no la excepción.

Documentamos la capa contractual y operativa

DPAs, catálogo de sub-procesadores, política de retención, bitácora de auditoría — todo queda documentado antes de ir a producción. No es un trámite: es la evidencia que vuestro departamento legal y cualquier auditor necesitan.

Tus datos son tuyos. Así los protegemos.

Lo que no es cierto — y por qué.

¿Qué arquitectura encaja con ustedes?

GDPR — La capa que envuelve ambas arquitecturas

Residencia de datos en la UE

Acuerdo de procesador y sub-procesadores

Accesos desde fuera de la UE

Pista de auditoría y trazabilidad

NIS2 — Cuando un fallo de IA se convierte en incidente reportable

EU AI Act — Art. 50: El usuario debe saber que habla con una IA

Cómo decidimos juntos