Propiedades y requisitos de las búsquedas
Para completar con éxito una búsqueda es necesario cumplir con los siguientes requisitos:
-
La cuenta de usuario que lanza la búsqueda desde la consola web tiene que tener asignado un rol con el permiso Buscar información en los equipos. Consulta Control y supervisión de la consola de administración para obtener más información sobre los roles.
-
Los equipos sobre los que se efectúan las búsquedas deben de contar con una licencia de Cytomic Data Watch asignada.
-
Los equipos sobre los que se efectúan las búsquedas deben de tener asignada una configuración de Cytomic Data Watch con la opción Permitir realizar búsquedas de información en los equipos habilitada.
Propiedades de las búsquedas
-
El número de búsquedas concurrentes por cada cuenta de usuario es 10. Pasado este número se mostrará un mensaje de error en la consola web.
-
El número máximo de búsquedas guardadas por cuenta de usuario es 30. Pasado este número se mostrará un mensaje de error en la consola web.
-
El número máximo de resultados en total por cada búsqueda es 10.000. Los resultados más allá de este número no se mostrarán en la consola web.
-
El número máximo de resultados por cada equipo es 10.000 / número de equipos sobre los que se ejecuta la búsqueda. De esta forma, si se busca sobre un parque de 100 equipos, el número máximo de resultados mostrados será 10.000 / 100 = 100 resultados por equipo.
-
El número mínimo de resultados mostrados por equipo, independientemente del número de equipos de la red es 10.
-
El número máximo de equipos sobre los que se ejecutan búsquedas de forma simultánea es 50. Si el número total de equipos que participaran en la búsqueda es mayor, las búsquedas más allá de este límite se mantendrán en espera hasta que las primeras se vayan completando.
Proceso de normalización
El proceso de normalización no influye en la detección de entidades.
Cytomic Data Watch aplica una serie de reglas a los datos recibidos del proceso de indexación para homogeneizarlos. Debido a que las búsquedas ejecutadas por el administrador se aplican sobre los datos ya normalizados, es necesario conocer estas reglas dado que pueden influir en los resultados mostrados en la consola web.
Transformación de las cadenas a minúsculas
Antes de almacenar una cadena en la base de datos, ésta se transforma a minúsculas.
Caracteres de separación
Cytomic Data Watch detecta un grupo de caracteres especiales que considera como separadores entre palabras y que retira completamente del índice, excepto si esos caracteres forma parte de una entidad:
-
Retorno de carro: \r
-
Salto de línea: \n
-
Tabulador: \t
-
Caracteres: " : ; ! ? - + _ * = ( ) [ ] { } , . | % \ / ’
Por ejemplo “Cytomic.Data(Watch” se almacenará como tres palabras sueltas sin los caracteres de puntuación: “cytomic”, “data” y “watch”.
Normalización de entidades
El proceso de normalización de entidades sigue reglas independientes:
Entidad | Caracteres de separación | Configuración de la indexación |
|
Se eliminan. La entidad se almacena en el índice como un único elemento. |
No se tiene en cuenta |
|
Se respetan. La entidad se almacena en el índice como un único elemento. |
No se tiene en cuenta |
|
Se utilizan como carácter separador. La entidad se almacena en el índice como varios elementos. |
Si se tiene en cuenta |
Ejemplos de normalización de entidades
-
“1.42.67.116-C” se almacena como la entidad de tipo IDCARD “14267116C”.
-
“192.168.1.1” se almacena como la entidad de tipo IP “192.168.1.1”.
-
“Calle Santiago de Compostela 5 1º Izquierda” se almacenará como “calle”, “santiago”, “de”, “compostela”, “izquierda” si el método de indexación es Solo texto o como “calle”, “santiago”, “de”, “compostela”, “5”, “1”, “izquierda” si el método de indexación es Todo.