# Проект: Конференции TED (дашборд в Tableau)

### Описание проекта
Настоящий проект посвящен исследованию деятельности некоммерческого фонда TED. Данный фонд организует глобальные конференции на различные тематики с широким охватом спикеров из разных областей.  
Для подробного анализа мы рассмотрим различные аспекты деятельности TED и каждому аспекту отведем отдельный дашборд для детального ознакомления с показателями в интересующем нас разделе.  

### Данные проекта
Для осуществления проекта нам представлено 5 датасетов:
1) идентичные по структуре `tableau_project_data_1.csv`, `tableau_project_data_1.csv` и `tableau_project_data_1.csv`, хранящие информацию о выступлениях и их соответствующих характеристиках. Структура данных файлов со следующими полями:
    - `talk_id` — идентификатор выступления;  
    - `url` — ссылка на запись выступления;  
    - `title` — название выступления;  
    - `description` — краткое описание;  
    - `film_date` — дата записи выступления;  
    - `duration` — длительность в секундах;  
    - `views` — количество просмотров;  
    - `main_tag` — основная категория, к которой относится выступление;  
    - `speaker_id` — уникальный идентификатор автора выступления;  
    - `laughter_count` — количество раз, когда аудитория смеялась в ходе выступления;  
    - `applause_count` — количество раз, когда аудитория аплодировала в ходе выступления;  
    - `language` — язык, на котором велось выступление;  
    - `event_id` — уникальный идентификатор конференции. 
    
2) файл с информацией о конференциях `tableau_project_event_dict.csv` со следующими полями:  
    - `conf_id` — уникальный идентификатор конференции;  
    - `event` — название конференции;  
    - `country` — страна проведения конференции.  
    
3) файл с информацией об авторах `tableau_project_speakers_dict.csv` со следующими полями:  
    - `author_id` — уникальный идентификатор автора выступления;  
    - `speaker_name` — имя автора;  
    - `speaker_occupation` — профессиональная область автора;  
    - `speaker_description` — описание профессиональной деятельности автора.  

### Объединение данных в единый источник
Для создания визуализаций и построения дашбордов в единый проект были произведены следующие соединения рабочих файлов:
- идентичные по структуре файлы (`tableau_project_data_1.csv`, `tableau_project_data_1.csv` и `tableau_project_data_1.csv`) объединены в единую таблицу `tableau_project_data_1+` по принципу `UNION`,
- таблица `tableau_project_event_dict` объединена с `tableau_project_data_1+` на уровне логической таблицы по полям `event_id` и `conf_id`,
- таблица `tableau_project_speakers_dict` объединена с `tableau_project_data_1+` на уровне логической таблицы по полям `speaker_id` и `author_id`.

Дополнительно необходимо указать, что на уровне источника данных добавлен 1 фильтр — данные отфильтрованы по полю `film_date` (только входящие в диапазон 2009-2021).

### Структура проекта
Настоящий проект представляет собой 4 дашборда, объединенных в одну презентацию (story) `Конференции TED`. В составе презентации представлены:
- дашборд `История выступлений`,
- дашборд `Тематики выступлений`,
- дашборд `Авторы выступлений`,
- дашборд `Просмотры самых эмоциональных конференций TED`.

### Проект

Проект доступен по ссылке: [Tableau Public](https://public.tableau.com/views/TEDconferenceproject_17193504615970/TEDconferences?:language=en-US&:sid=&:display_count=n&:origin=viz_share_link)

---------------------------------------

#### Дашборд `История выступлений`
Дашбор детализирует информацию по выступлениям конференции TED за наиболее активный период (2009-2021). Тематическое разделение выступлений представлено в абсолютных и относительных величинах. Также выступления редставлены относительно стран проведения конференций.

![image.png](attachment:image.png)

**Выводы и наблюдения**:
1. Чаще всего выступления проходят в США, Канаде и Великобритании.  
2. Наиболее популярные категории - наука, техника и культура.  
3. К 2020-2021 гг. количество конференций снизилось до минимума ввиду эпидемии. Сильнее снизилось количество выступлений по самым популярным темам.  

--------------------------------------

#### Дашборд `Тематики выступлений`
Дашборд детализирует выступления на конференциях TED за период 2009-2021. Представлено количество выступлений относительно тематики как отдельно, так и в связке со страной проведения. Также представлены относительные величины аплодисментов и смеха на длительность выступления. Дополнительно выявлена слабая связь длительности выступления с его просмотрами.

![image-2.png](attachment:image-2.png)

**Выводы и наблюдения**:
1. Наиболее популярными категориями выступлений являются наука, техника и культура.
2. Общая пропорция интересов для стран отдельно не отличается, однако Канада и другие страны демоснтрируют интерес к общественным тематикам интерес, соразмерный культурным.  
3. Категории, которые вызвали больше всего аплодисментов, - искусство, социальные изменения и образование. Минимальные показатели в этом отношении у дизайна, науки и глобальных проблемах. Выступление с самыми длительными аплодисментами - Сесиль Ричардс "Политический прогресс женщин - что дальше?"  
4.  Категории, которые вызвали больше всего смеха у аудитории, - искусство, дизайн и бизнес. Минимальные показатели в этом отношении у категории "Другое", социальных изменениях и глобальных проблемах. Выступление с самыми длительным показателем смеха - Маз Джобрани "Саудит, индиец и иранец входят в катарский бар".  
5. Между переменными просмотров и длительности наблюдается слабая корреляция. Самое длинное выступление - "3 секрета успеха Netflix". Самое просматриваемое выступление - "Твой язык тела определяет, кто ты".  

--------------------------------------

#### Дашборд `Авторы выступлений`
Дашборд детализирует информацию по области деятельности авторов, включая наиболее часто встречаемые сферы специализации, распределение числа выступлений авторов. Дооплнительно представлена информация в табличном виде по выступлениям и числу просмотров, а также по дополнительной информации об авторах в рамках конференций TED. 

![image-3.png](attachment:image-3.png)

**Выводы и наблюдения**:
1. Наиболее часто встречаямые области деятельности у авторов TED - писатель, журналист, художник, предприниматель. Категория "не определено" встречается реже только писателя и журналиста.
2. Подавляющее большинство выступало всего 1 раз. Больше всех на TED конференциях выступал Ханс Рослинг, эксперт по глобальному здоровью. 
3. Чаще остальных дизайнеров выступал Том Вуджек (4 выступления). Наименее просматриваемое его выступление - "Учимся использовать астролябию 13-ого столетия".  

--------------------------------------

#### Дашборд `Просмотры самых эмоциональных конференций TED`
Дашборд детализирует количество просмотров у конференций с наибольшими показателями эмоциональной вовлеченности (счетчики аплодисментов и смеха). Доступны визуализации с долями 10 наиболее эмоционально богатых конференций по аплодисментам и смеху, а также представлены диаграммы размаха по просмотрам таких конференций на фоне остальных.

![image-4.png](attachment:image-4.png)

**Выводы и наблюдения**:
1. Самые высокие показатели эмоциональных метрик (счетчиков аплодисментов и смеха) наблюдаются у собственных конференциях TED за 2010-е.  
2. Самые высокие метрики аплодисментов у TEDGlobal 2012, TED2019 и TED2018.  
3. Самые высокие метрики смеха у аудитории у  TED2019,  TED2016 и TED2018.  
4. Эмоциаональная вовлеченность аудитории влияет на число просмотров: медианные просмотры у конференций TED с высокими эмоциональными метриками выше, чем у прочих с меньшим целевым показателем.  

--------------------------------------

### Выводы
По факту реализации проекта мы можем прийти к следующим выводам:
- некоммерческий фонд TED функционирует уже достаточно долго: с 1984 года по настоящее время, однако своего масштаба фонд достиг к 2009 году;
- к периоду 2020-2021 наблюдается спад активности, что связано с пандемией COVID;  
- Подавляющее большиснтво выступлений проходят в США, Канаде и Великобритании;  
- Самые популярные категории: наука, техника, культура и общество, причем интерес в разных странах в целом однороден и не демонстрирует сильных отличий;  
- Выступления с самыми длительными авациями относятся к тематикам `искусство`, `социальные изменения` и `образование`, а антилидеры в этом отношении - `дизайн`, `наука` и `глобальные проблемы`. Выступление, получившее больше всех аплодисментов, - Сесиль Ричардс "Политический прогресс женщин - что дальше?";  
- Выступления с самым длительным смехом аудитории относятся к тематикам `искусство`, `дизайн` и `бизнес`. Нименьшая длительность смеха прослеживается у категорий `социальные изменения` и `глобальные проблемы`. Выступление, вызвавшее самый длительный суммарный смех у аудитории, - Маз Джобрани "Саудит, индиец и иранец входят в катарский бар...";  
- Длительность выступления почти не влияет на количество его просмотров;  
- Самое длинное выступление - "3 секрета успеха Netflix";
- Самое просматриваемое выступление - "Твой язык тела определяет, кто ты";
- Чаще всего на конференциях TED выступают писатели, журналисты, художники и предприниматели;
- Авторы крайне редко выступают на конференциях TED больше 2 раз за все время деятельности фонда;
- Подавляющее большинство авторов выступало на конференциях TED всего 1 раз;
- Больше всех на конференциях TED выступал Ханс Рослинг, эксперт по глобальному здоровью, - 8 раз;
- Эмоциональная вовлеченность аудитории, выражающаяся в аплодисментах и смехе, благотворно влияет на число просмотров;
- Самые высокие показатели эмоциональных метрик (счетчиков аплодисментов и смеха) наблюдаются у собственных конференциях TED за 2010-е: лидеры по смеху - TED2019, TED2016 и TED2018, лидеры по аплодисментам - TEDGlobal 2012, TED2019 и TED2018.