# Social Recomendations

En este notebook vamos a estudiar un caso de uso real de una base de datos de grafos para entender el potencial que nod puede proveer en casos reales.

## Talent.net
Talent.net es una aplicación de recomendaciones que permite a los usuarios descubrir su propia red profesional e identificar a otros usuarios y su conjunto de habilidades particulares. 

Los usuarios trabajan en empresas y en proyectos y tienen uno o más intereses o habilidades. 

Con esta información, Talent.net puede describir la red profesional de un usuario identificando otros suscriptores que comparten sus intereses. 

Las búsquedas se pueden restringir a la compañía en la que trabaja actualmente del usuario, o extenderala para abarcar toda la base de suscriptores. 

Talent.net también puede identificar individuos con habilidades específicas que están directa o indirectamente
conectados al usuario actual. 

Dichas búsquedas son útiles cuando se busca a un experto en la una materia para un compromiso laboral.

Para entender mejor el modelo de datos de talent.net podemos consultar la siguiente imagen.

<img src="../images/neo4j/talent1.png" alt="Initial Graph"/>

El gráfico de muestra sólo tiene dos compañías, cada una con varios empleados. Un empleado está conectado a la empresa en la que trabaja por una relación WORKS_FOR. Cada empleado está interesado (INTERESTED_IN) en uno o más temas y ha trabajado (TRABAJADO_ON) en uno o más proyectos. Ocasionalmente, los empleados de diferentes compañías pueden trabajar en el mismo proyecto.

Con este grafo podemos modelar dos casos de uso:

* Dado un usuario inferir sus relaciones sociales, esto es identificar su red social profesional basada en interes y habilidades comunes.
* Recomendar trabajadores con los que ha trabajado o que han trabajado con alguien con el que ha trabajado con una competencia concreta.

El primer caso de uso ayuda a construir comunidades entorno a intereses comunes y el segundo caso de uso ayuda a identificar personas para roles concretos en un trabajo.

Para empezar con el ejemplo, vamos a importar las librerías, borrar la base de datos existente y crear el grafo de ejemplo de la imagen anterior.

In [1]:
%load_ext cypher
%matplotlib inline

In [2]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
MATCH (n) DETACH DELETE n

17 nodes deleted.
21 relationship deleted.


In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
CREATE

## 1. Inferir relaciones sociales

In [5]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
MATCH (subject:User {name:'Sarah'})
MATCH (subject)-[:WORKS_FOR]->(company:Company)<-[:WORKS_FOR]-(person:User),
      (subject)-[:INTERESTED_IN]->(interest)<-[:INTERESTED_IN]-(person:User)
RETURN person.name AS name,
       count(interest) AS score,
       collect(interest.name) AS interests
ORDER BY score DESC

0 rows affected.


name,score,interests


El subgrafo que cumple el patrón anterior es el siguiente:

<img src="../images/neo4j/talent3.png" alt="Initial Graph"/>

La sentencia anterior sólo búsca personas que trabajan en la misma compañía que Sarah, si queremos extender la búsqueda para encontrar personas de otras compañías tendríamos que cambiar la consulta. 

In [6]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
MATCH (subject:User {name:'Sarah'})
MATCH (subject)-[:INTERESTED_IN]->(interest:Topic)<-[:INTERESTED_IN]-(person:User),
      (person)-[:WORKS_FOR]->(company:Company)
RETURN person.name AS name,
       company.name AS company,
       count(interest) AS score,
       collect(interest.name) AS interests
ORDER BY score DESC

0 rows affected.


name,company,score,interests


El subgrafo que cumple el patrón anterior es el siguiente:

<img src="../images/neo4j/talent4.png" alt="Initial Graph"/>

## 2. Buscar compañeros con intereses particulares



In [10]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
MATCH (subject:User {name:'Sarah'})
MATCH p=(subject)-[:WORKED_ON]->(:Project)-[:WORKED_ON*0..2]-(:Project)<-[:WORKED_ON]-(person:User)-[:INTERESTED_IN]->(interest:Topic)
WHERE person<>subject AND interest.name IN ['Java', 'Travel', 'Medicine']
WITH person, interest, min(length(p)) as pathLength
ORDER BY interest.name
RETURN person.name AS name,
       count(interest) AS score,
       collect(interest.name) AS interests,
       ((pathLength - 1)/2) AS distance
ORDER BY score DESC
LIMIT 10

0 rows affected.


name,score,interests,distance


El subgrafo que cumple el patrón anterior es el siguiente:

<img src="../images/neo4j/talent5.png" alt="Initial Graph"/>

<img src="../images/neo4j/talent6.png" alt="Initial Graph"/>