Sistemas de Recomendación Semánticos. Un análisis del estado de la cuestión

E. Peis; J. M. Morales-del-Castillo (Universidad de Granada); J. A. Delgado-López

Citación recomendada: E. Peis; J. M. Morales-del-Castillo; J. A. Delgado-López. Un análisis del estado de la cuestión [en linea]. "Hipertext.net", núm. 6, 2008. <http://www.hipertext.net>

  1. Introducción
  2. Criterios de clasificación de los sistemas de recomendación
  3. Sistemas de recomendación semánticos: revisión de la literatura
    3.1. Sistemas basados en ontologías y esquemas conceptuales
      3.1.1. Sistemas basados en redes de confianza
      3.1.2. Sistemas adaptables al contexto
  4. Conclusiones
  5. Bibliografía

 

1. Introducción

Uno de los principales retos que hoy día tienen que afrontar los sistemas de información es la gestión eficaz del gran volumen de documentos que almacenan para poder facilitar a los consumidores de información el acceso a recursos que satisfagan sus necesidades de una manera sencilla y ágil. Esta necesidad se vuelve más acuciante en una sociedad como la actual donde el nivel de exigencia de los usuarios es cada vez mayor.

Tradicionalmente, en el ámbito de las bibliotecas el problema de la sobrecarga de información se ha abordado adoptando diferentes medidas, como por ejemplo la creación de servicios de difusión selectiva de información (DSI), en los que, de acuerdo al perfil de los usuarios suscritos al servicio, se generan periódicamente (o a petición del propio usuario) una serie de alertas en las que se les notifica de la existencia de recursos que se adecuan a sus intereses (Aksoy et al., 1998), (Foltz; Dumais, 1992).

La Web, aunque presenta características propias que la diferencian claramente de las bibliotecas, padece, en esencia, el mismo problema y los esfuerzos para atenuarlo se centran en la aplicación de soluciones similares, como es el caso de los sistemas de filtrado de información (también conocidos como sistemas de recomendación). De hecho, los sistemas de recomendación podrían considerarse sistemas de DSI aplicados a la Web pero, lógicamente, con unas capacidades de filtrado infinitamente más potentes y sofisticadas. Estos sistemas aplican técnicas de filtrado de información que facilitan el acceso de los usuarios a la información que necesitan. En dominios textuales, los sistemas de filtrado evalúan y criban los recursos disponibles en la Web (normalmente en formato HTML o XML) básicamente para asistir a los usuarios en tareas de recuperación de información (Resnick; Varian, 1997) (principalmente mediante el uso de agentes de filtrado), aunque también se utilizan para predecir la valoración de los usuarios sobre ítems que aún no han evaluado (Szomszor, 2007).

El origen de este tipo de sistemas se remonta a principios de la década de los 90 del pasado siglo, cuando comienzan a surgir dentro de los servicios de newsgroups (grupos de noticias) servicios de filtrado de noticias que permitían a su comunidad de usuarios acceder exclusivamente a aquellas que potencialmente podían ser de su interés (Foltz; Dumais, 1992) (Resnick et al., 1994) (Stodolsky, 1990).

En la actualidad los sistemas de recomendación han evolucionado y es posible encontrarlos en diversos ámbitos de aplicación como en el comercio electrónico, donde se han convertido en una herramienta fundamental para los proveedores en línea (Schafer; Konstan; Riedl, 2001) o en los servicios de información científica.

No obstante, en cada dominio se presentan diferentes problemas a los que hay que dar diferentes soluciones. La necesaria capacidad de evolución ha implicado que los sistemas de recomendación se hayan diversificado.

De entre las múltiples posibles categorías de sistemas de recomendación que existen en este trabajo nos vamos a centrar en hacer una revisión de los denominados sistemas de recomendación semánticos, que en el último lustro están siendo objeto de un amplio tratamiento en la literatura especializada y que se caracterizan por basar su funcionamiento en diferentes tecnologías y vocabularios de la Web Semántica.

El artículo se estructura de la siguiente manera: en el apartado 2 se hace una relación de los diferentes criterios de clasificación que tradicionalmente se aplican a los sistemas de recomendación. En el apartado 3 se hace una revisión de los principales sistemas de recomendación semánticos hallados en la literatura. Por último, se apuntan una serie de conclusiones.

 

2. Criterios de clasificación de los sistemas de recomendación

Tradicionalmente, los sistemas de filtrado y recomendación se han clasificado en tres categorías principales de acuerdo a la técnica que utilizan para realizar el filtrado (Popescul et al., 2001): sistemas de recomendación sociales, sistemas de recomendación basados en contenido y sistemas de recomendación basados en factores económicos. Veamos cada uno de ellos con mayor detalle.

Los sistemas de filtrado social, también denominados de filtrado en colaboración o colaborativos (anglicismo con el que más comunmente son conocidos), utilizan la información proporcionada por usuarios de características similares al activo para generar recomendaciones, obviando el contenido de los recursos (se basa exclusivamente en las valoraciones que éstos reciben por parte de los usuarios). En este tipo de sistemas es habitual agrupar a los usuarios en categorías específicas o estereotipos que los caracterizan a través de una serie de valores de preferencia definidos por defecto y que representan las necesidades de información y hábitos de búsqueda más comunes del grupo. Este tipo de sistemas tiende a ofrecer resultados pobres cuando se dispone de poca información sobre los usuarios o estos tienen gustos muy heterogéneos (Popescul et al., 2001).

Los sistemas de filtrado basados en contenido generan recomendaciones equiparando las preferencias del usuario (expresadas por éste de forma implícita o explícita) con los metadatos o características utilizados en la representación de los recursos o productos, ignorando de esta forma la información relativa a otros usuarios. Estos sistemas, al igual que los sociales, son poco fiables cuando se dispone de poca información sobre el usuario.

Por su parte, los sistemas de recomendación basados en factores económicos son aquellos que generan recomendaciones basándose en elementos de coste (Resnick et al., 1994), como, por ejemplo, la relación entre el coste de un servicio y el beneficio que reporta al cliente o la relación entre el ancho de banda y el tamaño de un objeto a descargar. No obstante, el uso de este tipo de sistemas a día de hoy es muy marginal.

La tendencia actual se inclina por el desarrollo de sistemas de filtrado híbridos que combinan características de los sistemas basados en contenido y de los colaborativos, para atenuar las desventajas de cada una de ellos y mejorar de esta manera la eficiencia global del funcionamiento del sistema en términos de precisión y exhaustividad (Basu; Hirsh, Cohen, 1998) (Balabanovic; Shoham, 1997).

No obstante, existen otros criterios que podrían ser utilizados para su clasificación. Así, por ejemplo, atendiendo a la forma en que se capturan las preferencias del usuario, se puede distinguir entre sistemas donde la recogida de datos es explícita (cuando se pide al usuario que aporte de forma voluntaria sus valoraciones) y sistemas donde esta recogida se realiza de manera implícita (monitorizando la actividad del usuario en el sistema).

Según la metodología de filtrado de información es posible distinguir entre sistemas que realizan un filtrado pasivo (Rafter; Bradley; Smyth, 1999) (cuando se genera una única recomendación que es válida para todos los usuarios del sistema), y sistemas de filtrado activo (Boutilier; Zemer; Marlin, 2003) (Maltz; Ehrlich, 1995), en el que la recomendación se genera a partir del historial de recomendaciones de los usuarios para generar nuevas recomendaciones personalizadas. Un ejemplo de sistemas pasivos son aquellos que recomiendan los ítems más valorados por el conjunto de la comunidad de usuarios (es decir, el usuario no influye de forma directa sobre la información que recibe). Los sistemas activos son algo más complejos ya que generan las recomendaciones a partir de las opiniones de usuarios de perfil similar. Es más, dentro de los sistemas activos es posible definir dos modelos diferentes de recuperación de información (Gnasa et al, 2005): el modelo de pull de información (cuando el usuario debe lanzar una consulta al sistema para recibir la recomendación) y el modelo de push de información (cuando esa consulta se hace de forma implícita a través de las preferencias definidas en su perfil de usuario).

También se suele distinguir entre sistemas de filtrado centrados en el usuario (Xin et al., 2005), cuando las recomendaciones se obtienen equiparando la similitud entre usuarios de acuerdo a las preferencias almacenadas en su perfil y sistemas de filtrado centrados en ítems o productos (Resnick et al., 2004), en los que primero se buscan las relaciones que existen entre los diferentes ítems y a continuación se generan las recomendaciones a partir de las preferencias del usuario activo.

Atendiendo a la manera en que el algoritmo de filtrado procesa la información, encontramos sistemas que cargan todos los datos de forma residente en memoria para generar las recomendaciones y otros que utilizan una cantidad de datos menor a partir de la cual se generan modelos predictivos, que permiten procesar las recomendaciones de una manera más rápida.

Otro criterio consiste en diferenciar entre sistemas centralizados (cuando las descripciones de productos y perfiles de usuarios se encuentran almacenados en un servidor centralizado) y sistemas de recomendación no centralizados (generalmente desarrollados sobre redes P2P).

Como vemos, los criterios de clasificación son muchos y variados y no se limitan a los que hemos relacionado aquí. No obstante, en este trabajo nos centramos en hacer un análisis del estado de la cuestión sobre una categoría específica de sistemas de recomendación que están teniendo una amplia cobertura en la literatura científica en los últimos años: los sistemas de recomendación semánticos.

 

3. Sistemas de recomendación semánticos: revisión de la literatura

Independientemente del tipo de sistema, encontramos que una característica común a la gran mayoría de ellos es la utilización de perfiles para representar las necesidades de información e intereses a largo plazo de los usuarios. De esta manera, los perfiles de usuario se convierten en una pieza clave dentro de los sistemas de recomendación para obtener un filtrado eficiente, ya que un modelado de perfiles inadecuado puede conducir a unas recomendaciones de baja calidad y poco relevantes para el usuario.

Como hemos visto, los sistemas de recomendación utilizan normalmente agentes software para desempeñar tareas de filtrado de información en lugar del usuario. No obstante, estos modelos adolecen de algunas debilidades: i) los procesos de comunicación entre agentes, y entre agentes y usuarios se ven dificultados por las diversas formas en que la información está representada; y ii) la heterogeneidad en la representación de la información provoca a su vez que ésta no pueda ser reutilizada en otros procesos o por otras aplicaciones.

Para paliar estas deficiencias, es posible mejorar y enriquecer la representación de la información mediante la aplicación de tecnologías del proyecto Web Semántica (Berners-Lee; Hendler; Lassila, 2001).

En este trabajo vamos a considerar sistemas de recomendación semánticos aquellos que basan su funcionamiento sobre una base de conocimiento, normalmente definida a través de un esquema de conceptos (como una taxonomía o un tesauro) o una ontología, y que utilizan tecnologías de Web Semántica.

El proyecto Web Semántica se presenta como una extensión de la Web actual que pretende convertirse en una plataforma universal para el intercambio de información. En el modelo Web Semántica la información está dotada de un significado bien definido que permite una mejor colaboración entre humanos y máquinas (Berners-Lee, 2000). El proyecto se apoya básicamente en dos ideas: el marcado semántico de los recursos (lo que implica una separación formal entre el contenido y la estructura de los documentos) y el desarrollo de agentes software capaces de procesar y operar con estos recursos a nivel semántico (Berners-Lee, 2001), (Hendler, 2001) utilizando ontologías (entendidas como conceptualizaciones formalizadas de una parcela de realidad que dan sentido pleno a la información situándola en un contexto (Guarino, 1998) (Gruber, 1995).

En los últimos años han aparecido múltiples sistemas de recomendación que utilizan tecnologías del proyecto Web Semántica y proponen diversas soluciones de aplicación en diferentes ámbitos. Básicamente, se pueden clasificar en: sistemas basados en ontologías o esquemas de conceptos pero, además, encontramos otros sistemas que añaden filtros de información adicionales como los sistemas adaptables al contexto y los sistemas basados en redes de confianza.

 

3.1. Sistemas basados en ontologías y esquemas conceptuales

El sistema diseñado por Wang y Kong (2007) es un sistema de recomendación personalizado que intenta paliar los problemas de los sistemas de recomendación colaborativos usando, en forma de ontología, la información semántica de las características categóricas de un ítem. La similaridad por pares de usuario se calcula con el método de la media ponderada de tres medidas de similaridad: la similaridad del histórico de evaluaciones de dos usuarios (utilizando el coeficiente de correlación de Pearson sobre información de utilización del sistema en forma de matriz de datos de evaluación usuario-ítem); la similaridad de datos demográficos de dichos usuarios (calculada vía media ponderada); y, la similaridad del interés o preferencia de dichos usuarios basada en las similaridades semánticas de los ítems recuperados y/o evaluados. Al mismo tiempo, el sistema incorpora un mecanismo de cluster de usuarios offline para paliar el problema de la escalabilidad.

Khosravi, Farsani y Nematbakhsh (2006) sugieren una metodología para recomendaciones personalizadas en el contexto del comercio electrónico. Se trata de un procedimiento para recomendar productos a clientes potenciales. El algoritmo propuesto se basa en el modelado de información sobre productos y usuarios con OWL (Ontology Web Language). El proceso se inicia con la clasificación de productos y consumidores mediante OWL, lo que facilitará el análisis de la similaridad producto-cliente. En una segunda fase se seleccionan consumidores activos, teniendo en cuenta recomendaciones anteriores (el sistema no recomienda a un cliente si el número de sus recomendaciones anteriores no sobrepasa un cierto umbral). La clasificación de productos y clientes es utilizada para crear una matriz de evaluaciones productos-clientes. El algoritmo recomienda alguno de los productos de cada clase de entre las clases de productos basándose en el número de evaluaciones en la matriz.

Otro modelo que se aplica en el ámbito del comercio electrónico es el que presenta Ziegler, Lausen y Schmidt-Thieme (2004). El sistema se basa en el paradigma de recomendación colaborativa a través de contenido (Pazzani, 1999) y utiliza una taxonomía de productos a partir de la cual se definen los perfiles de los usuarios (sin necesidad de que estos proporcionen sus valoraciones de forma explícita). El perfil del usuario activo es utilizado para descubrir usuarios con intereses similares, cuyas valoraciones sirven al sistema para generar las recomendaciones.

Por su parte Jung y colaboradores (2005) proponen un sistema de recomendación basado en información personal que afirman es adecuado al contexto Web Semántica. El modelo se fundamenta en la representación de servicios Web y perfiles de usuario con tripletas RDF (Resource Description Framework). Cada compañía que quiera proporcionar servicios Web registra los datos en el repositorio de información, donde el sistema convierte los datos en documentos con formato RDF. El módulo de búsqueda extrae la información del repositorio y la envía al agente colector de documentos. El agente accede al espacio de nombre correspondiente y recoge los documentos RDF relativos a los servicios Web requeridos. Estos documentos son enviados al agente de integración de información, donde son fusionados en un solo documento RDF que contiene información relevante. Finalmente, el agente de recuperación de información extrae las tripletas RDF más relevantes conforme al perfil de usuario y se ofrecen al usuario los objetos almacenados coincidentes con dichas tripletas.

Otros sistemas se definen sobre estructuras descentralizadas como las redes P2P. Ese es el caso del modelo que presenta Díaz-Avilés (2005), donde la información no está disponible en un repositorio centralizado sino en cada uno de los componentes de la red. Los ítems u objetos se modelan mediante una ontología común que utilizan todos los miembros de la red. La selección de los componentes de la red se realiza de forma dinámica y la recomendaciones se generan utilizando un algoritmo de recomendación basado en el método del “vecino más cercano” que se ejecuta de forma local en cada componente de la red.

Una aproximación original es la propuesta de Cantador y Castells (2006) para desarrollar un modelo de red social semántica multicapa que permite definir el sistema desde diferentes perspectivas a partir de los intereses comunes que comparten los integrantes de la red. A partir de una serie de perfiles de usuario generados utilizando una ontología de conceptos, y teniendo en cuenta sus preferencias comunes, el sistema es capaz de acotar los diferentes grupos de conceptos del dominio. A partir de estos grupos es posible identificar conjuntos de usuarios con intereses similares que se interrelacionan entre sí en diferentes niveles semánticos (de acuerdo a sus preferencias). Esta metodología permite descubrir redes sociales implícitas que pueden ser aprovechadas para definir tanto sistemas de recomendación basados en contenido, como colaborativos.

Frente a estos modelos genéricos, encontramos muchos otros que se definen para dominios más específicos como el proyecto "Foafing the Music" (Celma; Ramirez; Herrera, 2005) que recomienda temas musicales y noticias relacionadas; el sistema que proponen Middleton y colaboradores (2002), para recomendar artículos científicos, que se basa en una ontología generada de forma automática a partir de la información extraída dinámicamente de diversas fuentes (información en línea, monitorización de usuarios, feedback, etc.); el sistema multi-agente AVATAR (Blanco Fernández et al., 2004) especializado en programas de televisión; o SemMF (Oldakowsky; Byzer, 2005) que genera recomendaciones de ofertas de trabajo calculando la similaridad semántica de dos conceptos de acuerdo a su situación dentro de una jerarquía de conceptos.

 

3.1.1. Sistemas basados en redes de confianza

Como hemos visto, una de las principales preocupaciones de los investigadores en el campo de los sistemas de recomendación semánticos es garantizar la fiabilidad y precisión de las recomendaciones que se generan. Para ello, muchos de ellos ofrecen un nivel de filtrado adicional fundamentado sobre de una red de confianza (Ziegler, 2004).

Adrian, Sauermann y Roth-Berghofer (2007) proponen ConTag, un sistema que asesora a los usuarios sobre las etiquetas más propicias para describir el contenido de diferentes recursos que se utilizan en una plataforma Web 2.0. Los documentos son transformados a formato RDF para posteriormente generar un mapa de materias (topic map) definido en SKOS Core, a partir del cual es posible calcular la similaridad de estas materias con los conceptos definidos en la ontología del sistema. Las etiquetas recomendadas por el sistema pueden ayudar al usuario a describir mejor el contenido del recurso, minimizando así problemas de sinonimia, homonimia, acrónimos y variantes ortográficas que pueden presentar las etiquetas definidas por los usuarios. Jäschke y colaboradores (2007) proponen un mecanismo de recomendación de etiquetas similar.

Szomszor y colaboradores (2007) proponen el uso de algoritmos de predicción para la integración de una folksonomía de películas con una base de conocimiento semántico sobre alquileres de películas por parte de los usuarios. La folksonomía es usada para enriquecer la base de conocimiento con descripciones y categorizaciones de títulos de películas, además de con representaciones de opiniones e intereses de los usuarios. La “nube” de etiquetas generada por la folksonomía es usada para construir perfiles de usuario mejorados, que reflejan el nivel de interés del usuario sobre diferentes tipos de películas y, por lo tanto, proporcionan una base para la predicción de calificaciones de películas no vistas. Para la construcción de la base de conocimiento sobre películas y sobre cómo las alquilan los usuarios emplean fuentes de la Web 2.0 (Internet Movie Database y Netflix Prize, respectivamente). Para proporcionar una representación homogénea de ambos conjuntos de datos se construye una ontología con OWL, en conjunción con la tecnología para mapping D2RQ, que permite tratar los datos de una base de datos relacional como grafos virtuales RDF.

En esta línea, Massa y Avessani (2004) presentan un modelo basado en la denominada “Web de Confianza”. El sistema toma como inputs una “matriz de confianza” (que representa el conjunto de declaraciones de confianza de la comunidad -los usuarios explicitan a aquellos otros en cuyas evaluaciones confían-) y una matriz de evaluaciones (que representa todas las evaluaciones dadas por los usuarios a los ítems) y produce, como output, una matriz de evaluaciones predecibles que los usuarios podrían asignar a los ítems. Esta matriz es usada por el sistema para recomendar los ítems preferidos por los usuarios. Es decir, el sistema selecciona de la columna de evaluaciones predecibles relativa a los usuarios, los ítems con más altos valores. De esta forma, se incrementa la cobertura de los sistemas de recomendación colaborativos y, al mismo tiempo, se mantiene la calidad de los ítems recomendados, paliando así, los problemas de arranque en frío (para nuevos usuarios) y la nula fiabilidad de los datos de usuarios maliciosos.

Una aproximación diferente es la que ofrece el sistema FOAFRealm (Kruk; Decker, 2005). Se construye sobre redes P2P y que dispone de una librería que permite a los usuarios gestionar sus propios perfiles definidos en FOAF (Friend of a Friend vocabulary). A su vez, las descripciones y categorías definidas por los usuarios están enriquecidas con términos extraídos de esquemas taxonómicos u ontologías. Para gestionar los problemas de seguridad que suelen presentarse en los sistemas de recomendación basados en arquitecturas distribuidas se define el concepto de “perfil extrapolado”, en el que los nuevos usuarios adquieren un perfil que se construye a partir del perfil de los usuarios que lo agregan como “amigo”, y que depende directamente del nivel de confianza que estos le otorgan (facilitándose de esta manera la localización de usuarios maliciosos).

De manera similar funciona Filmtrust (Golbek, 2005), un sitio web que integra un sistema de recomendación semántico colaborativo de películas que utiliza el vocabulario FOAF como base para la creación de una red social de confianza. En esta red cada individuo debe valorar la confianza que les merecen aquellos usuarios a los que añaden a su red de amigos (a partir de los cuales se generan las recomendaciones de películas). El sistema adicionalmente dispone de un mecanismo que permite determinar la precisión de las recomendaciones generadas.

Bedi y colaboradores (2007) definen un modelo novedoso que se basa en el uso de una serie de ontologías y del establecimiento de redes de confianza entre agentes. Cada agente tiene asociada una ontología personal temporal (de esta manera se amortiguan las posibles modificaciones que estas pueden sufrir en el tiempo) a partir de las cuales pueden generar recomendaciones independientes de dominio. Para calcular estos valores de recomendación la similaridad entre agentes se presupone implícitamente en el valor de confianza que los propios agentes se asignan entre sí al interactuar. También es novedosa la utilización en este tipo de sistemas de conjuntos difusos intuitivos (Atanassov, 1999) para gestionar la incertidumbre inherente al proceso de recomendación.

En la literatura también encontramos otros modelos de sistemas de recomendación que utilizan tecnologías propias de la Web 2.0, como los canales RSS. Así, el modelo presentado por Kobayashi y Saito (2006) propone un sistema para recomendar artículos periodísticos y noticias extraídos de canales RSS, utilizando como apoyo un tesauro cuyos términos se usan para representar tanto las materias de las noticias como las necesidades de información de los usuarios.

Otro ejemplo del uso de este vocabulario lo encontramos en el modelo presentado por Peis, Herrera-Viedma y Morales-del-Castillo (2008), en el que una serie de canales RSS cumplen el papel de "boletines de novedades", dentro de un servicio de DSI para bibliotecas digitales especializadas. El sistema se construye sobre una plataforma multi-agente y es capaz de generar alertas y recomendaciones de acuerdo a las preferencias definidas en los perfiles de usuario. Estos perfiles se construyen a partir de un tesauro especializado y se actualizan de forma dinámica a través de un mecanismo de descubrimiento de preferencias tácitas de usuarios, que utiliza técnicas de modelado lingüístico difuso.

 

3.1.2. Sistemas adaptables al contexto

Otra posibilidad son los sistemas de recomendación adaptables (o sensibles) al contexto. En este tipo de sistemas se analizan y toman en consideración diferentes factores (temporales, de lugar, nivel de experiencia del usuario, dispositivo que se está utilizando en el momento de recibir la recomendación, etc.) para inferir el contexto en que se encuentra el usuario y adaptar las recomendación a esas circunstancias.

Dentro de este grupo encontramos, por ejemplo, el modelo basado en contenido que proponen Kim y Kwon (2007). El funcionamiento del sistema se basa en la definición de “contextos de uso” que se corresponden con los diferentes niveles de especificidad de una ontología de conceptos. El sistema genera una recomendación a partir del conjunto de ítems más valorados por un usuario y a continuación es capaz de adaptar el nivel de especificidad de la información que es mostrada al individuo dependiendo del contexto de uso en que se encuentran los conceptos por los que muestra interés. Para determinar estos contextos el sistema utiliza cuatro ontologías: una ontología de productos, otra donde se definen los diferentes contextos de uso, una tercera sobre el registro histórico de actividades de los usuarios en el sistema, y una última ontología sobre los usuarios.

Loizou y Dasmahapatra (2006) proponen por su parte un sistema fundamentado sobre una ontología que incorpora información contextual tanto del proceso de recomendación como de los ítems a recomendar. Esta información contextual (por ejemplo, el tiempo de recomendación o la utilidad del ítem recomendado para el usuario) tratada con un aparato matemático basado en reglas heurísticas aplicadas sobre espacios vectoriales permite al sistema evaluar, de forma dinámica, la adecuación de una recomendación concreta.

También es interesante la propuesta de Yu y colaboradores (2007) que aplican este tipo de sistemas al ámbito del e-learning. El modelo pretende facilitar a los estudiantes los recursos que necesitan para llevar a cabo las tareas planteadas en los cursos. Se apoya en el uso de ontologías para representar de manera eficiente el conocimiento del sistema sobre los usuarios, sobre el contenido de los recursos y sobre el dominio específico de especialización del sistema para generar recomendaciones basadas en el contexto de uso (es decir, la recomendación es diferente dependiendo de diferentes factores como el nivel de experiencia, o de lo avanzado que esté el curso en el momento en que el usuario requiere la recomendación). El sistema no se limita a recomendar recursos adecuados al contexto, sino que sugiere al alumno otros recursos relacionados que le permiten ahondar en la materia y definir de esta manera un programa de estudios completo.

Otros modelos que aplican este tipo de filtrado son el propuesto por Laliwala, Sorathia y Chaudhary (2006) donde se desarrolla un sistema de recomendaciones semántico para servicios de información agrícola basado en eventos o el que presentan Woerndl, Schueller y Wojtech (2007) donde las ontologías son utilizadas para mejorar la descripción de servicios Web ofrecidos por terceros, y para desarrollar un servicio de recomendaciones colaborativo especializado en información turística para dispositivos móviles, capaz de gestionar tanto información estática (definida en los perfiles de los usuarios) como información dinámica (contextual).

 

4. Conclusiones

Los denominados sistemas de recomendación semánticos son aquellos cuya funcionalidad se apoya sobre una base de conocimiento definida normalmente como un esquema de conceptos (como una taxonomía o un tesauro) o una ontología.

El uso de ontologías en este tipo de sistemas permite paliar determinados problemas, entre los que se incluyen los siguientes:

  1. Garantizan la interoperabilidad de los recursos del sistema y la homogeneidad de la representación de la información.

  2. Permiten contextualizar de forma dinámica las preferencias de los usuarios en un dominio específico.

  3. Facilitan el trabajo en redes sociales y el filtrado colaborativo.

  4. Mejoran los procesos de comunicación entre agentes, y entre agentes y usuarios

  5. Permiten paliar el problema de “arranque en frio” al poder completar la información incompleta mediante inferencias.

  6. Posibilitan extender semánticamente las descripciones de los factores contextuales en que se encuentra el usuario.

  7. Mejoran la representación y descripción de los diferentes elementos del sistema.

  8. Mejoran la descripción de la lógica del sistema al admitir la inclusión de conjuntos de reglas.

  9. Proporcionan los medios necesarios para generar descripciones enriquecidas de servicios web y facilitar así a los agentes software su descubrimiento.

De los sistemas de recomendación semánticos, aquellos que utilizan alguna de las tecnologías del proyecto Web Semántica para definir esta base de conocimiento, son los más prometedores en cuanto a resultados a corto y medio plazo.

No obstante, la línea de investigación futura más sólida se dirigirá al desarrollo de sistemas mixtos, que utilicen herramientas participantes en el desarrollo del proyecto Web Semántica, junto a filtros adicionales, como los basados en redes de confianza (que asegura la fiabilidad de los resultados del proceso) y los que emplean información contextual (que permiten incrementar la precisión del filtrado).

 

5. Bibliografía

Aksoy, D. et al. (1998). "Research in Data Broadcast and Dissemination". Proc. of the 1st International Conference on Advanced Multimedia Content Processing, pp.194-207.

Balabanovic, M.S.Y. (1997). "Fab: content-based, collaborative recommendation". Communications of the ACM, v. 40, pp. 66-72.

Atanassov, K.T. (1999). "Intuitionistic Fuzzy Sets: Theory and Applications”. Heidelberg: Physica-Verlag.

Basu, C.; Hirsh, H. y Cohen, W. (1998). "Recommendation as classification: Using social and content-based information in recommendation". Proc. of the 15th National Conference on Artificial Intelligence, pp. 714-720.

Bedi, P.; Kaur, H. y Marwaha, S. (2007). "Trust based Recommender System for the Semantic Web". Proc. of the IJCAI07, pp. 2677-2682.

Berners-Lee, T., Hendler, J. y Lassila, O. (2001). "The Semantic Web: A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities". Scientific American, May.

Blanco Fernández, Y. et al. (2004). "AVATAR: An Advanced Multi-Agent Recommender System of Personalized TV Contents by Semantic Reasoning". En: X. Zhong et al., (Ed.) "Web Information System Engineering". Lecture Notes in Computer Science, LNCS. Berlin, Heidelberg: Springer Verlag, pp. 415-421.

Boutilier, C.; Zemel, R.S. y Marlin, B. (2003). "Active collaborative filtering". Proc. Of the 19th Annual Conference on Uncertainty in Artificial Intelligence, pp. 98-106.

Cantador, I. y Castells, P. (2006). "Multilayered Semantic Social Network Modeling by Ontology-Based User Profiles Clustering: Application to Collaborative Filtering". Managing Knowledge in a World of Networks, pp. 334-349.

Celma, O; Ramírez, M. y Herrera, P. (2005). "Foafing the music: A music recommendation system based on RSS feeds and user preferences". Proc. Of the 6th Int. Conference on Music Information Retrieval (ISMIR), pp. 464-457.

Díaz-Avilés, V.E. (2005). Semantic Peer-To-Peer recommender Systems (Tesis doctoral), <http://citeseer.ist.psu.edu/semantic-peer-to-peer1.pdf> [Retrieved 23/02/2008].

Farsani, H.K. y Nematbakhsh, M.A. (2006). "A Semantic Recommendation Procedure for Electronic Product Catalog". International Journal of Applied Mathematics and Computer Sciences, v. 3, pp. 86-91.

Foltz, P.W. y Dumais, S.T. (1992). "Personalized information delivery: an analysis of information filtering methods". Communications of the ACM, v. 35, pp. 51-60.

Gnasa, M. et al. (2005). "Personalized Peer Filtering for a Dynamic Information Push". En: "Anonymous Foundations of Intelligent Systems", Berlin, Heidelberg: Springer Verlag, pp. 650-659.

Golbeck, J. (2005). "Semantic Web Interaction through Trust Network Recommender Systems". Proc. of the ISWC05 Workshop on End User Semantic Web Interaction, pp. 2005.

Gruber, T.R. (1995). "Toward principles for the design of ontologies used for knowledge sharing". International Journal of Human-Computer Studies, v. 43, pp. 907-928.

Guarino, N. (1998). "Formal ontology and information systems". En N. Guarino (ed.). "Formal ontology and information systems: Proc. of FOIS’98", Amsterdam: IOS Press, pp. 3-17.

Hendler, J. (2001). "Agents and the Semantic Web". IEEE Intelligent Systems, n. March/April, pp. 30-37.

Jäschke, R. et al. (2007). "Tag Recommendations in Folksonomies". Knowledge Discovery in Databases: PKDD07, pp. 506-514.

Jung, K. et al. (2005). "RDF Triple Processing Methodology for the Recommendation System Using Personal Information". Proc. Of the Int. Conference on Next Generation Web Services Practices, pp. 241-247.

Kim, S. y Kwon, J. (2007). "Effective Context-aware Recommendation on the Semantic Web". International Journal of Computer Science and Network Security, v. 7, pp. 154-159.

Kobayashi, I. y Saito, M. (2006). "A study on information recommendation system that provides information related to user’s inquiry for information retrieval". Proc. Oh the 2006 IEEE/WIC/ACM Int. Conference on Web Intelligence and Intelligent Agent Technology, pp. 385-388.

Kruk, S.R. y Decker, S. (2005). "Semantic Social Collaborative filtering with FOAFRealm". Proc. Of the Semantic Desktop ISWIC.

Laliwala, Z.; Sorathia, V. y Chaudhary, S. (2006). "Semantic and Rule Based Event-driven Services-Oriented Agricultural Recommendation System". Proc. Of the 26th IEEE Conference on distributed Computing Systems Workshop (ICDSW’06), pp. 24-30.

Loizou, A. y Dasmahapatra, S. (2006). "Recommender Systems for the Semantic Web". Proc. of the ECAI 2006, pp. 76-81.

Maltz, D. y Elrich, K. (1995). "Pointing the way: active collaborative filtering", Proc. of the SIGCHI Conference on human Factors in Computing Systems, pp. 202-209.

Massa, P. y Avessani, P. (2004). "Trust-Aware Collaborative Filtering for Recommender Systems". En: "On the Move to Meaningful Internet Systems 2004: CoopIS, DOA, and ODBASE", Berlin, Heidelberg: Springer, pp. 3-17.

Middleton, S.E. et al. (2002). "Exploiting synergy between ontologies and recommender systems". Proc. of the Semantic Web Workshop, v. 55, pp. 41-50.

Oldakowsky, R. y Byzer, C. (2005). SemMF: A framework for calculating semantic similarity of objects represented as RDF graphs (Poster of the 4th Semantic Web Conference), <http://ww.corporate-semantic-web.de/pub/SemMF_ISWC2005.pdf> [Retrieved: 07/06/2007].

Pazzani, M.J. (1999). "A framework for collaborative, content-based and demographic filtering". Artif. Intell. Rev., v. 13, pp. 393-408.

Peis, E., Herrera-Viedma, E. y Morales-del-Castillo, J.M. (2008). "Servicio semántico de difusión selectiva de información (DSI) para bibliotecas digitales". El profesional de la información [en prensa],

Popescul, A. et al. (2001). "Probabilistic models for unified-collaborative and content-based recommendation in sparse-data environments". Proc. of the 17th Conference on Unceertainty in Artificial Intelligence (UAI), pp. 467-444.

Rafter, R.; Bradley, K. y Smyth, B. (1999). "Passive Profiling and Collaborative Recommendation". Proc. of the 10th. Irish Conference on Artificial Intelligence and Cognitive Science.

Resnick , M.L. et al. (2004). "Persuasive Design Through Intelligent Recommendation Systems". Proc. of the Human Factors and Ergonomics Society Annual Meeting, pp. 1503-1507.

Resnick, P. et al. (1994). "GroupLens: An open architecture for collaborative filtering of netnews". Proc. of the ACM Conference on Computer Supported Cooperative Work, pp. 175-186.

Resnick, P. y Varian, H.R. (1997). "Recommender Systems". Special issue of Communications of the ACM, v. 40.

Schafer, J.B.; Konstan, J.A. y Riedl, J. (2001). "E-commerce recommendation applications". Data Mining and Knowledge Discovery , v. 5, pp. 115-153.

Stodolsky, D.S. (1990). "Invitational Journals Based Upon Peer Consensus". Psycoloquy, v. 1 (15).

Szomszor, M. et al. (2007). "Folksonomies, the Semantic Web, and Movie Recommendation". Proc. of the ESWC’07, pp. 71-84.

Wang, R.Q. y Kong, F.S. (2007). "Semantic-Enhanced Personalized Recommender System". Machine Learning and Cybernetics: Proc. of the Int. Conference on Machine Learning and Cybernetics , v. 7 (19-22), pp. 4069-4074.

Woerndl, W.; Schueller, C. y Wojtech, R. (2007). "A Hybrid Recommender System for Context-aware Recommendations of Mobile Applications". Proc. of the IEEE 3rd International Workshop on Web Personalisation, Recommender Systems and Intelligent User Interfaces (WPRSIUI'07).

Xin, Z. et al. (2005). "Information Push-Delivery for User-Centered and Personalized Service". En: "Anonymous Fuzzy Systems and Knowledge Discovery", Berlin, Heidelberg: Springer, pp. 594-602.

Yu, Z. et al. (2007). "Ontology-Based Semantic Recommendation for Context-Aware E-Learning". Proc. of the 4th Conference on Ubiquitous Intelligence and Computing, v. 4611, Berlin, Heidelberg: Springer, pp. 898-907.

Ziegler, N. (2004). "Semantic Web Recommender Systems". Proc. of the joint ICDE/EDBT Workshop.

Ziegler, N.; Lausen, G. y Schmidt-Thieme, L. (2004). "Taxonomy driven computation of product recommendations". Proc. of the 30th ACM Conference on Information and Knowledge Management, pp. 406-415.



Creative Commons License
Last updated 02-08-2019
© Universitat Pompeu Fabra, Barcelona