Modelo booleano

Para explicar este modelo de recuperación tenemos que tener en cuenta que los documentos se representan mediante vectores binarios y las consultas se crean con las palabras que componen la búsqueda unidas a través de los operadores AND, OR y NOT.



Las soluciones se van evaluando aplicando la teoría de conjuntos para lo cual se hace una representación en árbol y se realizan las operaciones desde los nodos hojas de éste, hasta la raíz.



Cada posible solución es evaluada y se le asigna el valor de relevante o irrelevante sin poder asignar un término medio. Esta es la principal diferencia con los demás modelos de recuperación en los que veremos como para el modelo de espacio de vectores y para el modelo probabilístico, el valor que representa la solución a la consulta varía su valor indicando su relevancia.



Como principales desventajas del modelo booleano destacan:



  • No es posible indicar el grado de importancia de un término de indexación, ya que sólo se indica si el término es relevante o no.
  • No es posible ordenar los resultados obtenidos.
  • La función semejanza sólo tiene 2 valores.
  • El lenguaje de consulta no es sencillo.


Como principal ventaja encontramos la sencillez de este modelo. Además existen adaptaciones de este modelo de recuperación que tratan de subsanar los inconvenientes anteriores





Modelos

Más información