# 그래프를 바이럴 마케팅에 어떻게 활용할까

## 복습용 질문거리
- 그래프를 통한 전파의 예시
    - 정보, 행동, 고장, 질병 등
- 전파모형 2가지 (쉽고 대표적인것)
    - 의사결정 기반의 전파 모형
        - 각각의 정점의 개인의 행복을 최대화하도록 의사결정하는 상황을 모형화
        - 대표 예시 : 선형 임계치 모형
    - 확률적 전파 모형
        - 질병의 전파 등 확률적 과정을 모형화
        - 대표 예시 : 독립적 전파 모형
- 바이럴 마케팅과 전파 최대화 문제
    - 전파를 최대화하는 시드 집합을 찾는 문제
    - 정점 중심성 휴리스틱, 탐욕 알고리즘 등
- 실습 : 전파 모형 시뮬레이터 구현

## 강의 소개
- 그래프의 전파는 어떻게 일어나나?
- 전파(Influence)를 모델링할 수 있는 간단한 수학적 모형들
- 전파 최대화 문제
    - 주어진 그래프와 규칙에서 전파를 최대화
- 전파가 단계별로 어떻게 이루어지는 지 집중

## Further Questions
- 감염병의 전파를 모델링 하기 위해서는 감염과 더불어 감염된 환자의 회복을 고려해야 합니다. 감염된 사람이 회복될 수 있고, 한 번 감염이 된 사람은 추가적으로 감염이 되지 않는다고 가정한다면 어떻게 전파 모델을 설계할 수 있을까요? 

---

## 그래프 전파의 예시
- 온라인 소셜 네트워크를 통한 정보 전파
- 온라인 소셜 네트워크를 통한 행동 전파 : 아이스 버킷 챌린지, 펭귄 문제
- 컴퓨터 네트워크에서 일부장비 고장이 전파되어 전체 네트워크 마비 : 파워 그리드 정전 전파도 유사함
- 사회에서 질병 전파 : 코로나-19, 메르스, 사스
![image.png](attachment:image.png)

---

## 의사결정 기반의 전파 모형

#### 선형 임계치 모형
- 카카오톡 ,라인 중 어떤 것을 사용하고 계신지? 왜 그렇게 결정했는지?
    - 주변사람의 의사결정이 본인의 의사결정에 영향을 미침
- 수학적으로 추상화 해보자
    - 친구관계 두사람 u, v 가정
    - 호환되지 않는 기술 A, B 중 하나 선택
    - 둘 모두 A 기술을 사용할 경우, 행복이 a만큼 증가
    - 둘 모두 B 기술을 사용할 경우, 행복이 b만큼 증가함
    - 달 다른 기술 사용할때 행복 증가하지 않음
    ![image.png](attachment:image.png)
    ![image-2.png](attachment:image-2.png)
    ![image-3.png](attachment:image-3.png)
    - 즉 이웃 중 A를 선택한 비율이 임계치 q를 넘을 때만 A를 선택함
    ![image-4.png](attachment:image-4.png)
    ![image-5.png](attachment:image-5.png)
    - 계속해서 전파가 됨
    ![image-6.png](attachment:image-6.png)
    ![image-7.png](attachment:image-7.png)
    

---

## 확률적 전파 모형
- 언제 확률적 전파 모형을 사용할까?
    - 코로나의 전파과정 ? 코로나에 걸리기로 의사결정을 하는 사람은 없으니깐 의사결정 모델은 적합하지 않음
    - 확률적으로 생각해야 함 (확률적 전파모형)
- 독립적 전파모형이란??
    - 방향성이 있고, 가중치가 있는 그래프 가정
    - 첫 감염자를 시드 집합(Seed Set)이라고 함
    ![image-8.png](attachment:image-8.png)
    ![image-9.png](attachment:image-9.png)

---

## 바이럴 마케팅과 전파 최대화 문제
- 바이럴 마케팅이란?
    - 소비자들로 하여금 상품에 대한 긍정적인 입소문을 내게 하는 기법
    - 소문의 시작점 중요
        - 미들턴 효과 (영국 윌리엄 왕자의 부인 케이트 미들턴이 사면 따라 사는것)
- 시드 집합의 중요성
    - 소문의 시작점이 중요하기 때문
- 전파 최대화 문제 (Influence Maximization)
    - 그래프, 전파 모형, 시드 집합의 크기가 주어졌을 때 전파를 최대화하는 시드 집합을 찾는 문제
    - 전파 모형은 선형 임계치 모형, 독립 전파 모형을 포함한 다양한 모형을 고려 할 수 있음
    - 즉 케이트 미들턴 집합을 찾아내는 문제
    - 경우의 수가 너무 많아서 계산은 NP-hard임이 증명됨, 못품
    - 최고의 시드집합을 찾는 것은 포기
- 정점 중심성 휴리스틱
    - 휴리스틱, 근사 알고리즘을 써서 찾음 (휴리스틱은 실험적으로는 잘 동작할 수 있지만, 이론적으로는 전혀 보장하지 못하는 것)
    - 시드집합 크기 k개 있을때, 정점의 중심성이 높은 순으로 k개 정점을 선택하는 방법
    - 중심성은 어떻게 계산?
        - 페이지 랭크 점수
        - 연결 중심성
        - 근접 중심성 : 다른 정점과의 평균거리를 측정하여 적은 것이 근접 중심성을 갖음
        - 매개 중심성 : 최단 경로에 많이 놓이는 정점일수록 많은 정점을 연결하기 때문에 중심성이 높음
- 탐욕 알고리즘 (Greedy Algorithm)
    - 최초 전파자를 한번에 한 명씩 선택
        - {x}를 먼저 구하고, {x,y}를 구하고, {x, y, x}를 구하고 이런 식으로 목표 크기에 도달할 때까지 반복함
    - 얼마나 정확함??
        - 독립 전파 모형의 경우 이론적으로 정확도가 일부 보장됨
        - 즉, 탐욕 알고리즘으로 찾은 시드집합에 의한 전파의 크기 = 0.632 * 최고의 시드집합 전파 크기