Propiedades y requisitos de las búsquedas

Para completar con éxito una búsqueda es necesario cumplir con los siguientes requisitos:

  • La cuenta de usuario que lanza la búsqueda desde la consola web tiene que tener asignado un rol con el permiso Buscar información en los equipos. Consulta Control y supervisión de la consola de administración para obtener más información sobre los roles.

  • Los equipos sobre los que se efectúan las búsquedas deben de contar con una licencia de Cytomic Data Watch asignada.

  • Los equipos sobre los que se efectúan las búsquedas deben de tener asignada una configuración de Cytomic Data Watch con la opción Permitir realizar búsquedas de información en los equipos habilitada.

Propiedades de las búsquedas

  • El número de búsquedas concurrentes por cada cuenta de usuario es 10. Pasado este número se mostrará un mensaje de error en la consola web.

  • El número máximo de búsquedas guardadas por cuenta de usuario es 30. Pasado este número se mostrará un mensaje de error en la consola web.

  • El número máximo de resultados en total por cada búsqueda es 10.000. Los resultados más allá de este número no se mostrarán en la consola web.

  • El número máximo de resultados por cada equipo es 10.000 / número de equipos sobre los que se ejecuta la búsqueda. De esta forma, si se busca sobre un parque de 100 equipos, el número máximo de resultados mostrados será 10.000 / 100 = 100 resultados por equipo.

  • El número mínimo de resultados mostrados por equipo, independientemente del número de equipos de la red es 10.

  • El número máximo de equipos sobre los que se ejecutan búsquedas de forma simultánea es 50. Si el número total de equipos que participaran en la búsqueda es mayor, las búsquedas más allá de este límite se mantendrán en espera hasta que las primeras se vayan completando.

Proceso de normalización

El proceso de normalización no influye en la detección de entidades.

Cytomic Data Watch aplica una serie de reglas a los datos recibidos del proceso de indexación para homogeneizarlos. Debido a que las búsquedas ejecutadas por el administrador se aplican sobre los datos ya normalizados, es necesario conocer estas reglas dado que pueden influir en los resultados mostrados en la consola web.

Transformación de las cadenas a minúsculas

Antes de almacenar una cadena en la base de datos, ésta se transforma a minúsculas.

Caracteres de separación

Cytomic Data Watch detecta un grupo de caracteres especiales que considera como separadores entre palabras y que retira completamente del índice, excepto si esos caracteres forma parte de una entidad:

  • Retorno de carro: \r

  • Salto de línea: \n

  • Tabulador: \t

  • Caracteres: " : ; ! ? - + _ * = ( ) [ ] { } , . | % \ / ’

Por ejemplo “Cytomic.Data(Watch” se almacenará como tres palabras sueltas sin los caracteres de puntuación: “cytomic”, “data” y “watch”.

Normalización de entidades

El proceso de normalización de entidades sigue reglas independientes:

Entidad Caracteres de separación Configuración de la indexación
  • Cuentas bancarias

  • Tarjetas de crédito

  • Número de identidad personal

  • Números de teléfono

  • Números de carnet de conducir

  • Números de pasaporte

  • Números de la seguridad social

Se eliminan. La entidad se almacena en el índice como un único elemento.

No se tiene en cuenta

  • Direcciones IP

  • Direcciones de correo electrónico

Se respetan. La entidad se almacena en el índice como un único elemento.

No se tiene en cuenta

  • Nombres y apellidos

  • Direcciones físicas

Se utilizan como carácter separador. La entidad se almacena en el índice como varios elementos.

Si se tiene en cuenta

Reglas de normalización de entidades

Ejemplos de normalización de entidades

  • “1.42.67.116-C” se almacena como la entidad de tipo IDCARD “14267116C”.

  • “192.168.1.1” se almacena como la entidad de tipo IP “192.168.1.1”.

  • “Calle Santiago de Compostela 5 1º Izquierda” se almacenará como “calle”, “santiago”, “de”, “compostela”, “izquierda” si el método de indexación es Solo texto o como “calle”, “santiago”, “de”, “compostela”, “5”, “1”, “izquierda” si el método de indexación es Todo.