Cytomic Data Watch (Supervisión de información sensible)

Los ficheros clasificados como PII (Personally Identificable Information) son archivos sin estructura interna con información que permite identificar a personas relacionadas con la empresa (clientes, trabajadores, proveedores, etc.). Esta información es de carácter personal y su tipo es muy variado, como pueden ser números de la seguridad social, números de teléfono y direcciones de correo electrónico, entre otros.

Cytomic Data Watch es el módulo de seguridad de Advanced EDR que permite a las empresas cumplir con las regulaciones sobre protección de datos, como por ejemplo la GDPR. Además, supervisa y mejora la visibilidad de la información personal (PII) almacenada en la infraestructura IT de las organizaciones.

Para ello, Cytomic Data Watch ofrece tres funcionalidades clave:

  • Genera un inventario diario y completo de ficheros PII que incluye información básica, como puede ser su nombre, extensión y el nombre del equipo donde se encontró.

  • Descubre, audita y monitoriza en tiempo real el ciclo de vida de los ficheros PII: desde los datos en reposo, las operaciones efectuadas sobre ellos y su llegada y comunicación hacia el exterior.

  • Ofrece herramientas de búsqueda flexible por contenido y borrado de ficheros duplicados que contienen datos personales, con el objetivo de limitar su almacenamiento y difusión en la red de la empresa.

Introducción al funcionamiento de Cytomic Data Watch

Para una correcta comprensión de los procesos involucrados en el descubrimiento y seguimiento de la información personal almacenada en los equipos de la empresa, es necesario asimilar algunos conceptos relativos a las tecnologías utilizadas en Cytomic Data Watch.

Entidad

Cada pieza o grupo de palabras con significado propio referido a un tipo concreto de información personal recibe el nombre de “entidad”. Entidades comúnmente analizadas son el DNI, nombres y apellidos y números de teléfono, entre otras.

Debido a la naturaleza ambigua y variable del lenguaje natural en sus múltiples idiomas, una misma entidad puede presentarse de formas muy diferentes, por lo que es necesario aplicar algoritmos flexibles y adaptables para su detección. De manera general, el análisis de entidades busca formatos o expresiones predefinidas, y utiliza el contexto local en torno a esa detección, o la presencia o ausencia de determinadas palabras clave, para evitar falsos positivos. Consulta Entidades y países soportados para más información.

Fichero PII

Una vez realizada la identificación de entidades se evalúa el contexto en el que aparecen para determinar si con la información que aportan es posible identificar a una persona concreta. En tal caso, el fichero será susceptible de ser protegido por protocolos específicos de tratamiento y acceso a los datos que permitan a la empresa cumplir con la normativa vigente (GDPR, PCI, etc.). Esta evaluación combina un modelo Machine learning supervisado con un modelo experto basado en ponderación de entidades y análisis del contexto global del documento, para clasificar a un fichero con entidades detectadas como un fichero PII a proteger.

Ficheros sin estructura interna y componentes IFilter

Para clasificar un fichero como PII, Cytomic Data Watch analiza archivos sin estructura (ficheros de texto en múltiples formatos, hojas de cálculo, ficheros de presentación Powerpoint etc.) en busca de entidades. Para interpretar correctamente el contenido de estos archivos se requieren algunos componentes de terceros fabricantes instalados en el equipo del usuario. Estos componentes reciben el nombre de “IFilters” y no forman parte del paquete de instalación deAdvanced EDR. Microsoft Search, Microsoft Exchange Server y Microsoft Sharepoint Server, entre otros servicios del sistema operativo y productos independientes, utilizan los componentes IFilter para indexar los ficheros del usuario y habilitar búsquedas por contenido.

Cada formato de fichero compatible con Cytomic Data Watch tiene su propio componente IFilter asociado, y muchos de ellos forman parte de la instalación básica de Windows, aunque otros tienen que ser instalados o actualizados de forma manual.

Microsoft Filter Pack es un paquete de distribución gratuito que contiene todos los componentes IFilter asociados a la suite de ofimática Microsoft Office. Una vez instalado, Cytomic Data Watch será capaz de analizar el contenido de todos los formatos de fichero soportados por la suite. Consulta Instalación del componente Microsoft Filter Pack para más información.

Proceso de indexación

Es el proceso de inspección y almacenaje del contenido de todos los ficheros soportados por Cytomic Data Watch con el fin de generar un inventario de ficheros PII y permitir búsquedas de ficheros por contenido. El proceso de indexación es una tarea de bajo impacto en el rendimiento del equipo, aunque su finalización puede alargarse en el tiempo. Por esta razón el administrador puede programar su inicio o limitarla para acelerar su finalización y para mejorar el resultado de los resultados devueltos por las búsquedas. Consulta El proceso de indexación para más información.

Proceso de normalización

Al ejecutar el proceso de indexación Cytomic Data Watch aplica ciertas reglas para homogeneizar los datos recogidos. El objetivo de este proceso es almacenar de forma individual cada palabra y facilitar su posterior búsqueda, así como reducir su tiempo de ejecución. La reglas a aplicar en el proceso de normalización varían si se trata de almacenar una entidad o texto plano. Consulta Propiedades y requisitos de las búsquedas para más información.

Inventario de ficheros PII

Una vez indexado el equipo e identificadas las entidades y los ficheros PII, Cytomic Data Watch construye un inventario accesible por el administrador de la red con los nombres de los ficheros y sus características, que se envía al servidor Advanced EDR una vez al día. Consulta Inventario de ficheros PII para más información.

Cytomic Data Watch no envía el contenido de los ficheros PII al servidor Advanced EDR. Unicamente se envían sus atributos (nombre, extensión etc.) y el número y tipo de entidades descubiertas.

Búsquedas de ficheros

Cytomic Data Watch localiza ficheros por su nombre, extensión o contenido en las unidades de almacenamiento indexadas de los equipos de la red.

Las búsquedas se ejecutan en tiempo real: tan pronto como el administrador lanza una búsqueda, ésta se despliega en los equipos de la red y comienza a reportar resultados conforme se van produciendo, sin esperar a completar la ejecución por completo. Consulta Búsqueda de ficheros para más información.

Seguimiento de las acciones sobre ficheros PII

Cytomic Data Watch monitoriza los eventos realizadas sobre los ficheros PII y los envía a la consola Cytomic Insights. Esta herramienta muestra la evolución de los ficheros PII permitiendo determinar si fueron copiados, movidos, enviados por correo, etc. Para obtener más información sobre Cytomic Insights consulta la Guía de administración de Cytomic Data Watch en https://info.cytomicmodel.com/resources/guides/DataWatch/es/DATAWATCH-guia-ES.pdf.