Cuando introduces texto en una interfaz de IA, ese texto va a algún sitio. No en el sentido paranoico —la mayoría de los proveedores tienen políticas serias de privacidad— sino en el sentido técnico y legal: los datos que introduces pasan por servidores de terceros, pueden usarse para entrenamiento futuro y están sujetos a las políticas de privacidad de cada proveedor. Entender exactamente qué pasa con esos datos es responsabilidad del usuario.
Lo que ocurre con tus datos
Cuando envías un mensaje a un servicio de IA, ocurren varias cosas:
El texto se transmite a los servidores del proveedor. No hay procesamiento local en la mayoría de los servicios de consumo. Tu texto, incluyendo cualquier información personal o confidencial que contenga, viaja a través de internet a los servidores de la empresa.
El proveedor puede almacenar las conversaciones. La duración y condiciones de ese almacenamiento varían según el proveedor y el plan. Algunos guardan el historial indefinidamente por defecto; otros tienen políticas de retención más cortas.
Las conversaciones pueden usarse para entrenamiento. Este es el punto más importante para la privacidad. Muchos proveedores, especialmente en sus planes gratuitos, reservan el derecho de usar las conversaciones para mejorar sus modelos. En la práctica, esto significa que el texto que introduces puede convertirse en datos de entrenamiento.
El personal del proveedor puede tener acceso. Para moderación de contenido, gestión de incidencias o revisión de calidad, empleados del proveedor pueden acceder a conversaciones. Las políticas sobre quién puede acceder y bajo qué condiciones varían.
Diferencias entre proveedores
Las políticas varían significativamente entre proveedores y entre planes del mismo proveedor:
OpenAI (ChatGPT):
- Plan gratuito: las conversaciones pueden usarse para entrenamiento por defecto (se puede desactivar en la configuración)
- Plan de pago (Plus): misma política, con opción de desactivar
- API: los datos no se usan para entrenamiento por defecto
- Enterprise: mayores garantías de privacidad y aislamiento de datos
Anthropic (Claude):
- Similar estructura: las interfaces de consumidor tienen políticas más permisivas que la API
- La API no usa los datos para entrenamiento por defecto
- Teams y Enterprise ofrecen garantías adicionales
Google (Gemini):
- Integración con el ecosistema de Google: revisar qué datos comparte con otros servicios de Google
En general: los planes de pago y especialmente los planes API/Enterprise tienen mejores garantías de privacidad que los planes gratuitos. Leer los Términos de Servicio y la Política de Privacidad antes de introducir información sensible no es paranoia: es diligencia básica.
Información que nunca debes introducir
Independientemente del proveedor y del plan, hay categorías de información que tienen alto riesgo si se introducen en servicios de IA externos:
Datos personales de terceros: nombres completos combinados con información identificable, números de identidad, datos de salud, información financiera de clientes o empleados. En muchos casos, compartir estos datos con un proveedor externo sin consentimiento explícito del titular es una infracción del RGPD.
Secretos comerciales: especificaciones técnicas no publicadas, estrategias de negocio confidenciales, datos financieros internos antes de su publicación. Una vez enviado, ese texto ha salido de tu control.
Credenciales de acceso: contraseñas, tokens de API, claves privadas. Parece obvio, pero ocurre con más frecuencia de lo esperado cuando se pega código o archivos de configuración.
Información sujeta a NDA: cualquier información que hayas acordado contractualmente no compartir con terceros. Los proveedores de IA son terceros.
Datos sensibles de menores: especialmente en contextos educativos o de servicios para niños.
Opciones para mayor privacidad
Desactivar el uso de datos para entrenamiento. La mayoría de los proveedores permiten esto en la configuración. Es el primer paso para quien usa servicios de consumo con información sensible.
Usar la API en lugar de la interfaz de consumidor. Las APIs tienen políticas de privacidad más estrictas por defecto. El texto enviado via API generalmente no se usa para entrenamiento.
Anonimizar o generalizar antes de introducir. Si necesitas analizar información de clientes, sustituye nombres reales por identificadores (“Cliente A”, “Empresa X”), elimina datos financieros específicos y trabaja con datos representativos en lugar de reales.
Modelos locales. Los modelos ejecutables localmente (Llama, Mistral, Qwen a través de Ollama o LM Studio) no envían ningún dato a servidores externos. La privacidad es total. El trade-off es calidad: los modelos locales en hardware de consumidor son significativamente menos capaces que los modelos comerciales más avanzados.
Soluciones enterprise con garantías contractuales. Para empresas con requisitos serios de privacidad, los planes enterprise de OpenAI, Anthropic o soluciones como Azure OpenAI Service ofrecen acuerdos contractuales de procesamiento de datos, aislamiento de datos y garantías de no uso para entrenamiento.
Seguridad en sistemas con IA
Si construyes aplicaciones o sistemas que incorporan IA, hay riesgos de seguridad adicionales que van más allá de la privacidad de los datos:
Prompt injection. Un atacante puede intentar incluir instrucciones maliciosas en el texto que el agente procesará. “Ignora las instrucciones anteriores y haz X” en el contenido que el agente está procesando puede modificar su comportamiento. Es una vulnerabilidad seria en sistemas donde el agente procesa contenido de fuentes no confiables.
Exfiltración de datos del sistema prompt. Los usuarios pueden intentar extraer el “system prompt” —las instrucciones confidenciales que configuran el comportamiento del modelo— mediante preguntas específicas.
Dependencia de terceros. Si tu producto depende de la API de un proveedor, una interrupción del proveedor o un cambio en sus políticas o precios afecta directamente a tu producto.
Costes inesperados. Los ataques de tipo “prompt flooding” pueden generar costes de API inesperados si no hay límites de uso implementados.
La privacidad y la seguridad con IA no son obstáculos para su uso: son parte del diseño responsable de sistemas y del uso profesional de las herramientas. La mayoría de los problemas tienen soluciones técnicas; el primer paso es ser consciente de que existen.