# Исследование истории TED-конференций

TED (от англ. technology, education, design — «технологии, образование, дизайн») — некоммерческий фонд, который проводит популярные конференции. На них выступают специалисты из разных областей и читают лекции на актуальные социальные, культурные и научные темы. 

Необходимо наглядно показать статистику по историческим данным конференции. 

## Введение 

**Проект направлен** на исследование истории TED-конференций, поиск интересных особенностей и презентацию полученных результатов.

**Задачи исследования**:

* Исследовать данные и узнать: как количество конференций распределено по времени, в каких странах чаще всего проходили выступления, какие категории выступлений наиболее популярны, какие категории чаще вызывают аплодисменты и смех аудитории, как изменялся состав категорий во времени;
* Построить визуализацию, подкрепляющую выводы;
* Подготовить презентацию. 

**Описание исходных данных:**

В проекте будут использоваться 5 датасетов:

* tableau_project_data_1.csv
* tableau_project_data_2.csv
* tableau_project_data_3.csv
* tableau_project_event_dict.csv
* tableau_project_speakers_dict.csv

Файлы tableau_project_data_1.csv, tableau_project_data_2.csv, tableau_project_data_3.csv хранят данные выступлений. У них одинаковая структура:

* *talk_id* — идентификатор выступления;
* *url* — ссылка на запись выступления;
* *title* — название выступления;
* *description* — краткое описание;
* *film_date* — дата записи выступления;
* *duration* — длительность в секундах;
* *views* — количество просмотров;
* *main_tag* — основная категория, к которой относится выступление;
* *speaker_id* — уникальный идентификатор автора выступления;
* *laughter_count* — количество раз, когда аудитория смеялась в ходе выступления;
* *applause_count* — количество раз, когда аудитория аплодировала в ходе выступления;
* *language* — язык, на котором велось выступление;
* *event_id* — уникальный идентификатор конференции.

Файл tableau_project_event_dict.csv — справочник конференций. Описание таблицы:

* *conf_id* — уникальный идентификатор конференции;
* *event* — название конференции;
* *country* — страна проведения конференции.

Файл tableau_project_speakers_dict.csv — справочник авторов выступления. Описание таблицы:

* *author_id* — уникальный идентификатор автора выступления;
* *speaker_name* — имя автора;
* *speaker_occupation* — профессиональная область автора;
* *speaker_description* — описание профессиональной деятельности автора.

**Исследование пройдет в 4 основных этапа:**

 * Обзор исходных данных;
 * Формирование визуализаций;
 * Сборка дашбордов;
 * Подготовка презентации. 

## Проект в Tableau 

Ссылка на виз: https://public.tableau.com/views/history_of_TED_viz/TED-?:language=en-US&:sid=&:redirect=auth&:display_count=n&:origin=viz_share_link

Резервная ссылка на хранилище с воркбуком: https://drive.google.com/file/d/1v3EGvzhjg_pyC6t-6SQ_VCLD2yXroqX1/view?usp=sharing

https://github.com/netrunner55746/Yandex-Practicum.Data-Analyst/raw/main/artifacts/history_of_TED_viz_vs.twbx

## Общий вывод

История выступлений:

* Чаще всего выступления проходят в США (1885 выступлений, 55% от общего количества), Канаде (593, 17%) и Великобритании (537, 16%);
* Наиболее популярные категории выступлений: культура (18 выступлений в самом активном 2017 году, 6% от общего количества), наука (65, 20%), технологии (43, 13%), общество (78, 24%) , глобальные проблемы (3, 1%); 
* В 2021 году увеличилась доля выступлений по тематикам технологии (+12%), глобальные проблемы (+12%), нет изменений по категории общество и отсутствуют выступления по темам культура и наука.

Тематики выступлений:

* Наиболее популярные категории выступлений: наука (21% от общего количества выступлений) и технологии (18%);
* Степень популярности некоторых категорий разнится в зависимости от стран проведения конференции: категория "общество" на 5% менее популярна в Великобритании, чем в Канаде и США, "глобальные проблемы" - наоборот, более популярна, "бизнес", "дизайн" менее популярны в Канаде, а "наука"  и "технологии" превосходят аналогичные категории в США и Великобритании;
* Чаще всего аплодисменты вызывает категория "Развлечения" с медианным значением 0,005 аплодисментов в секунду, остальные категории из топ-10 держатся на примерно одинаковом уровне. Выступление, которому аплодировали больше всего, приходится на категорию "социальных изменений";
* Смех вызывают чаще всего "образование" (медиана количества ситуаций со смехом в секунду 0,005), "бизнес" (0,005), "дизайн" (0,004), "развлечения" (0,004), реже всего смех вызывают "глобальные проблемы" (0,001) и "социальные изменения" (0,001). Самое смешное выступление пришлось на категорию "культура" (0,07);
* Корреляции длительности выступления и количества просмотров нет, либо является крайне слабой. Самое популярное выступление: "Do schools kill creativity" (72М просмотров), самое долгое выступление "3 secrets to Netflix's success" (63 минуты).

Авторы выступлений:

* Среди авторов преобладают виды деятельности: писатель (13% от общего количества), автор книг (9%), художник (9%);
* 89% всех авторов имеют только 1 выступление, наибольшее количество выступлений у Hans Rosling - 10;
* Среди дизайнеров чаще всего выступал Tom Wujec - 4 выступления, из которых наименее популярным является "Learn to use the 13th-century astrolabe" с 940 тыс. просмотров;

Отклик зрителей по странам-хозяйкам конференций:

* Наибольшее число зрителей - на выступлениях в Канаде (медиана количества просмотров 1837061), Швейцарии (1646188) и Австралии (1411002);
* Наиболее восхищенная публика - в Танзании (медиана количества аплодисментов на время выступления 0,003), Бразилии (0,003) и Канаде (0,003);
* Самые смешные выступления по реакции зрителей - в Австралии (медиана количества отдельных ситуаций со смехом на время выступления 0,005), США (0,003) и Канаде (0,003);
* В совокупности Канада является лидером по отклику зрителей. 