# **Исследование данных об инвестициях венчурных фондов в компании-стартапы**

**ER-диаграмма**

![изображение.png](attachment:ad8e1063-c406-48ea-892a-07c2c0285b54.png)

## Посчитайте, сколько компаний закрылось

```SQL
SELECT COUNT(status)
FROM company
WHERE status = 'closed';
```

## Отобразите количество привлечённых средств для новостных компаний США. Используйте данные из таблицы company. Отсортируйте таблицу по убыванию значений в поле funding_total

```SQL
SELECT SUM(funding_total)
FROM company
WHERE category_code = 'news'
  AND country_code = 'USA'
GROUP BY name
ORDER BY SUM(funding_total) DESC;
```

## Найдите общую сумму сделок по покупке одних компаний другими в долларах. Отберите сделки, которые осуществлялись только за наличные с 2011 по 2013 год включительно

```SQL
SELECT SUM(price_amount)
FROM acquisition
WHERE term_code = 'cash'
  AND EXTRACT (YEAR
               FROM CAST(acquired_at AS date)) IN (2011,
                                                   2012,
                                                   2013);
```

## Отобразите имя, фамилию и названия аккаунтов людей в твиттере, у которых названия аккаунтов начинаются на 'Silver'

```SQL
SELECT first_name,
       last_name,
       twitter_username
FROM people
WHERE twitter_username LIKE 'Silver%';
```

## Выведите на экран всю информацию о людях, у которых названия аккаунтов в твиттере содержат подстроку 'money', а фамилия начинается на 'K'

```SQL
SELECT *
FROM people
WHERE twitter_username LIKE '%money%'
  AND last_name LIKE 'K%';
```

## Для каждой страны отобразите общую сумму привлечённых инвестиций, которые получили компании, зарегистрированные в этой стране. Страну, в которой зарегистрирована компания, можно определить по коду страны. Отсортируйте данные по убыванию суммы

```SQL
SELECT country_code,
       SUM(funding_total)
FROM company
GROUP BY country_code
ORDER BY SUM(funding_total) DESC;
```

## Составьте таблицу, в которую войдёт дата проведения раунда, а также минимальное и максимальное значения суммы инвестиций, привлечённых в эту дату. Оставьте в итоговой таблице только те записи, в которых минимальное значение суммы инвестиций не равно нулю и не равно максимальному значению

```SQL
SELECT funded_at,
       MIN(raised_amount),
       MAX(raised_amount)
FROM funding_round
GROUP BY funded_at
HAVING MIN(raised_amount) <> MAX(raised_amount)
AND MIN(raised_amount) <> 0;
```

## Создайте поле с категориями: для фондов, которые инвестируют в 100 и более компаний, назначьте категорию high_activity; для фондов, которые инвестируют в 20 и более компаний до 100, назначьте категорию middle_activity; если количество инвестируемых компаний фонда не достигает 20, назначьте категорию low_activity. Отобразите все поля таблицы fund и новое поле с категориями

```SQL
SELECT *,
       CASE
           WHEN invested_companies >= 100 THEN 'high_activity'
           WHEN invested_companies >= 20
                AND invested_companies < 100 THEN 'middle_activity'
           WHEN invested_companies < 20 THEN 'low_activity'
       END
FROM fund;
```

## Для каждой из категорий, назначенных в предыдущем задании, посчитайте округлённое до ближайшего целого числа среднее количество инвестиционных раундов, в которых фонд принимал участие. Выведите на экран категории и среднее число инвестиционных раундов. Отсортируйте таблицу по возрастанию среднего

```SQL
WITH f AS
  (SELECT *,
          CASE
              WHEN invested_companies>=100 THEN 'high_activity'
              WHEN invested_companies>=20 THEN 'middle_activity'
              ELSE 'low_activity'
          END AS activity
   FROM fund)
SELECT f.activity,
       ROUND(AVG(f.investment_rounds)) AS avg_round
FROM f
GROUP BY f.activity
ORDER BY avg_round;
```

## Проанализируйте, в каких странах находятся фонды, которые чаще всего инвестируют в стартапы. Для каждой страны посчитайте минимальное, максимальное и среднее число компаний, в которые инвестировали фонды этой страны, основанные с 2010 по 2012 год включительно. Исключите страны с фондами, у которых минимальное число компаний, получивших инвестиции, равно нулю. Выгрузите десять самых активных стран-инвесторов: отсортируйте таблицу по среднему количеству компаний от большего к меньшему. Затем добавьте сортировку по коду страны в лексикографическом порядке

```SQL
SELECT country_code,
       MIN(invested_companies),
       MAX(invested_companies),
       AVG(invested_companies)
FROM fund
WHERE EXTRACT(YEAR
              FROM CAST(founded_at AS date)) IN (2010,
                                                 2011,
                                                 2012)
GROUP BY country_code
HAVING MIN(invested_companies) <> 0
ORDER BY AVG(invested_companies) DESC, country_code
LIMIT 10;
```

## Отобразите имя и фамилию всех сотрудников стартапов. Добавьте поле с названием учебного заведения, которое окончил сотрудник, если эта информация известна

```SQL
SELECT p.first_name,
       p.last_name,
       e.instituition
FROM people AS p
LEFT JOIN education AS e ON p.id = e.person_id;
```

## Для каждой компании найдите количество учебных заведений, которые окончили её сотрудники. Выведите название компании и число уникальных названий учебных заведений. Составьте топ-5 компаний по количеству университетов

```SQL
WITH p AS
  (SELECT id,
          company_id
   FROM people),
     e AS
  (SELECT person_id,
          instituition
   FROM education)
SELECT c.name,
       COUNT(DISTINCT e.instituition) AS count_inst
FROM company AS c
LEFT JOIN p ON p.company_id = c.id
LEFT JOIN e ON p.id = e.person_id
GROUP BY c.name
ORDER BY count_inst DESC
LIMIT 5;
```

## Составьте список с уникальными названиями закрытых компаний, для которых первый раунд финансирования оказался последним

```SQL
WITH c AS
  (SELECT id,
          name
   FROM company
   WHERE status = 'closed'),
     f AS
  (SELECT company_id
   FROM funding_round
   WHERE is_first_round = 1
     AND is_last_round = 1)
SELECT DISTINCT c.name
FROM c
INNER JOIN f ON f.company_id = c.id;
```


## Составьте список уникальных номеров сотрудников, которые работают в компаниях, отобранных в предыдущем задании

```SQL
WITH c AS
  (SELECT id,
          name
   FROM company
   WHERE status = 'closed'),
     f AS
  (SELECT company_id
   FROM funding_round
   WHERE is_first_round = 1
     AND is_last_round = 1)
SELECT DISTINCT p.id
FROM people AS p
WHERE company_id IN
    (SELECT DISTINCT c.id
     FROM c
     INNER JOIN f ON f.company_id = c.id);
```


## Составьте таблицу, куда войдут уникальные пары с номерами сотрудников из предыдущей задачи и учебным заведением, которое окончил сотрудник

```SQL
WITH c AS
  (SELECT id,
          name
   FROM company
   WHERE status = 'closed'),
     f AS
  (SELECT company_id
   FROM funding_round
   WHERE is_first_round = 1
     AND is_last_round = 1)
SELECT DISTINCT person_id,
                instituition
FROM education
WHERE person_id IN
    (SELECT DISTINCT p.id
     FROM people AS p
     WHERE company_id IN
         (SELECT DISTINCT c.id
          FROM c
          INNER JOIN f ON f.company_id = c.id));
```

## Посчитайте количество учебных заведений для каждого сотрудника из предыдущего задания. При подсчёте учитывайте, что некоторые сотрудники могли окончить одно и то же заведение дважды

```SQL
WITH c AS
  (SELECT id,
          name
   FROM company
   WHERE status = 'closed'),
     f AS
  (SELECT company_id
   FROM funding_round
   WHERE is_first_round = 1
     AND is_last_round = 1)
SELECT person_id,
       COUNT(instituition)
FROM education
WHERE person_id IN
    (SELECT DISTINCT p.id
     FROM people AS p
     WHERE company_id IN
         (SELECT DISTINCT c.id
          FROM c
          INNER JOIN f ON f.company_id = c.id))
GROUP BY person_id;
```

## Дополните предыдущий запрос и выведите среднее число учебных заведений (всех, не только уникальных), которые окончили сотрудники разных компаний. Нужно вывести только одну запись, группировка здесь не понадобится

```SQL
WITH c AS
  (SELECT id,
          name
   FROM company
   WHERE status = 'closed'),
     f AS
  (SELECT company_id
   FROM funding_round
   WHERE is_first_round = 1
     AND is_last_round = 1)
SELECT AVG(count_inst)
FROM
  (SELECT person_id,
          COUNT(instituition) AS count_inst
   FROM education
   WHERE person_id IN
       (SELECT DISTINCT p.id
        FROM people AS p
        WHERE company_id IN
            (SELECT DISTINCT c.id
             FROM c
             INNER JOIN f ON f.company_id = c.id))
   GROUP BY person_id) AS b;
```

## Напишите похожий запрос: выведите среднее число учебных заведений (всех, не только уникальных), которые окончили сотрудники Facebook (сервис, запрещённый на территории РФ)

```SQL
SELECT AVG(count_inst)
FROM
  (SELECT person_id,
          COUNT(instituition) AS count_inst
   FROM education
   WHERE person_id IN
       (SELECT DISTINCT p.id
        FROM people AS p
        WHERE company_id IN
            (SELECT id
             FROM company
             WHERE name = 'Facebook'))
   GROUP BY person_id) AS b;
```

## Составьте таблицу из полей: name_of_fund — название фонда; name_of_company — название компании; amount — сумма инвестиций, которую привлекла компания в раунде. В таблицу войдут данные о компаниях, в истории которых было больше шести важных этапов, а раунды финансирования проходили с 2012 по 2013 год включительно

```SQL
WITH i AS
  (SELECT funding_round_id,
          company_id,
          fund_id
   FROM investment),
     c AS
  (SELECT id,
          name,
          funding_total,
          milestones
   FROM company),
     f AS
  (SELECT id,
          name
   FROM fund),
     fr AS
  (SELECT id,
          company_id,
          funded_at,
          raised_amount
   FROM funding_round
   WHERE funded_at BETWEEN '2012-01-01' AND '2013-12-31')
SELECT DISTINCT f.name AS name_of_fund,
                c.name AS name_of_company,
                fr.raised_amount AS amount
FROM investment AS i
LEFT JOIN c ON i.company_id = c.id
LEFT JOIN f ON i.fund_id = f.id
INNER JOIN fr ON fr.id = i.funding_round_id
WHERE c.milestones > 6
  AND EXTRACT (YEAR
               FROM cast(fr.funded_at AS date)) in (2012,
                                                    2013);
```


## Выгрузите таблицу, в которой будут такие поля: название компании-покупателя; сумма сделки; название компании, которую купили; сумма инвестиций, вложенных в купленную компанию; доля, которая отображает, во сколько раз сумма покупки превысила сумму вложенных в компанию инвестиций, округлённая до ближайшего целого числа. Не учитывайте те сделки, в которых сумма покупки равна нулю. Если сумма инвестиций в компанию равна нулю, исключите такую компанию из таблицы. Отсортируйте таблицу по сумме сделки от большей к меньшей, а затем по названию купленной компании в лексикографическом порядке. Ограничьте таблицу первыми десятью записями. 

20. **

```SQL
WITH a AS
  (SELECT id,
          acquiring_company_id,
          price_amount
   FROM acquisition
   WHERE price_amount <> 0),
     ac AS
  (SELECT id,
          acquired_company_id
   FROM acquisition),
     c AS
  (SELECT id,
          name AS name_cons
   FROM company),
     co AS
  (SELECT id,
          name AS name_prod,
          funding_total
   FROM company
   WHERE funding_total <> 0)
SELECT c.name_cons,
       a.price_amount,
       co.name_prod,
       co.funding_total,
       round (price_amount / funding_total)
FROM a
LEFT JOIN ac ON a.id = ac.id
LEFT JOIN c ON c.id = a.acquiring_company_id
INNER JOIN co ON co.id = ac.acquired_company_id
ORDER BY price_amount DESC,
         name_prod
LIMIT 10;

```


## Выгрузите таблицу, в которую войдут названия компаний из категории social, получившие финансирование с 2010 по 2013 год включительно. Проверьте, что сумма инвестиций не равна нулю. Выведите также номер месяца, в котором проходил раунд финансирования

```SQL
SELECT c.name,
       EXTRACT (MONTH
                FROM CAST(fr.funded_at AS date))
FROM company AS c
INNER JOIN funding_round AS fr ON fr.company_id = c.id
WHERE c.category_code = 'social'
  AND fr.raised_amount <> 0
  AND EXTRACT (YEAR
               FROM CAST(fr.funded_at AS date)) IN (2010,
                                                    2011,
                                                    2012,
                                                    2013);
```

## Отберите данные по месяцам с 2010 по 2013 год, когда проходили инвестиционные раунды. Сгруппируйте данные по номеру месяца и получите таблицу, в которой будут поля: номер месяца, в котором проходили раунды; количество уникальных названий фондов из США, которые инвестировали в этом месяце; количество компаний, купленных за этот месяц; общая сумма сделок по покупкам в этом месяце.

```SQL
WITH fr AS
  (SELECT EXTRACT (MONTH
                   FROM CAST (f.funded_at AS date)) AS month_date,
                  COUNT(DISTINCT fund.name) AS count_fund
   FROM fund
   LEFT JOIN investment AS i ON fund.id = i.fund_id
   LEFT JOIN funding_round AS f ON i.funding_round_id = f.id
   WHERE f.funded_at BETWEEN '2010-01-01' AND '2013-12-31'
     AND fund.country_code = 'USA'
   GROUP BY month_date),
     a AS
  (SELECT EXTRACT(MONTH
                  FROM CAST (acquired_at AS date)) AS month_date,
          COUNT(acquired_company_id) AS count_comp,
          SUM(price_amount) AS sum_cons
   FROM acquisition
   WHERE acquired_at BETWEEN '2010-01-01' AND '2013-12-31'
   GROUP BY month_date)
SELECT fr.month_date,
       fr.count_fund,
       a.count_comp,
       a.sum_cons
FROM fr
LEFT JOIN a ON a.month_date = fr.month_date;
```

## Составьте сводную таблицу и выведите среднюю сумму инвестиций для стран, в которых есть стартапы, зарегистрированные в 2011, 2012 и 2013 годах. Данные за каждый год должны быть в отдельном поле. Отсортируйте таблицу по среднему значению инвестиций за 2011 год от большего к меньшему

```SQL
WITH c_2011 AS
  (SELECT country_code,
          AVG(funding_total) AS sum_2011
   FROM company
   WHERE founded_at BETWEEN '2011-01-01' AND '2011-12-31'
   GROUP BY country_code),
     c_2012 AS
  (SELECT country_code,
          AVG(funding_total) AS sum_2012
   FROM company
   WHERE founded_at BETWEEN '2012-01-01' AND '2012-12-31'
   GROUP BY country_code),
     c_2013 AS
  (SELECT country_code,
          AVG(funding_total) AS sum_2013
   FROM company
   WHERE founded_at BETWEEN '2013-01-01' AND '2013-12-31'
   GROUP BY country_code)
SELECT c_2011.country_code,
       c_2011.sum_2011,
       c_2012.sum_2012,
       c_2013.sum_2013
FROM c_2011
INNER JOIN c_2012 ON c_2012.country_code = c_2011.country_code
INNER JOIN c_2013 ON c_2013.country_code = c_2011.country_code
ORDER BY sum_2011 DESC;
```