Intoduccion a los modelos de recuperacion

Segun la mayoria de estudios que se han estado realizando en los ultimos años la recuperacion y organizacion de la informacion es uno de los aspectos que han cobrado un mayor relevancia. En la actualidad estos estudios resaltan la vital importancia que ha cobrado ese campo. Esto se debe en gran medida a que los buscadores de internet estan situados como el primer metodo utilizado para obtener cualquier tipo de informacion sea para el uso que sea (academico, ludico, empresarial).



Debido a esto es de vital importancia conocer cuales son los metodos o modelos de recuperacion utilizados por los grandes buscadores. En los ultimos años y debido a los intereses economicos derivados de buenos posicionamientos en los distintos buscadores se esta produciendo un boom en todos los campos relacionados con este tema, por tanto es necesario conocer como se estructuran los modelos de recuperacion citados con anterioridad.



Normalmente nos basamos en terminos para indexar y tambien para recuperar la informacion. Los terminos son palabras clave que representan el documento(no tienen porque aparecer en el). El problema que se nos plantea es que solo tenemos los componentes lexicos: carecemos del significado semantico y sintactico. Los tres modelos clasicos utilizan esta simplificacion, fijandose solo en el aspecto lexico.La principal clasificacion para los modelos clasicos de recuperacion de informacion es la siguiente:



  • Modelo booleano


  • Modelo vectorial


  • Modelo probabilistico


    • Esta es la clasificacion que utilizaremos, ya que es la mas extendida y a nuestro parecer la de mayor utilidad.