Студент: Гимишян А.

Группа: М05-312

Кафедра: ТЦТ

Термин «инновация» происходит от латинского слова innovatio, что означает «обновление» или «изменение». В широком смысле инновация — это внедрение чего-то нового: идеи, метода, технологии, которое приводит к улучшениям в какой-либо сфере. Это может быть связано с внедрением новых продуктов, услуг, процессов или даже новых форм организационной структуры.

Можно выделить следующие уровни новизны инноваций:

1. **Радикальные инновации**
    - Относятся к принципиально новым продуктам.
    - Приводят к созданию продуктов или технологий, которые ранее не существовали.

2. **Инкрементальные инновации**
    - Касаются значительного усовершенствования существующих продуктов.
    - Включают улучшения в функции и характеристиках существующих продуктов или процессов.

3. **Инновации, связанные с внедрением новых или значительно усовершенствованных методов производства**
    - Новая технология производства.
    - Более высокий уровень автоматизации.
    - Новые методы организации производства, применительно к новым технологиям.

4. **Продуктовые инновации** (по технологическим параметрам)
    - Применение новых материалов.
    - Применение новых полуфабрикатов и комплектующих.
    - Получение принципиально новых функций (принципиально новые продукты).

5. **Процессные инновации** (по технологическим параметрам)
    - Новая технология производства.
    - Более высокий уровень автоматизации.
    - Новые методы организации производства.

6. **Инновации по типу новизны для рынка**
    - Новые для отрасли в мире.
    - Новые для отрасли в стране.
    - Новые для данного предприятия (группы предприятий).

In [1]:
import pandas as pd

In [2]:
# Загрузка данных
file_path = 'Lab3.csv'
data = pd.read_csv(file_path, delimiter=';')

In [4]:
data.head()

Unnamed: 0,Region,Dev_projRD,Dev_1disemb,Dev_2disemb,Dev_emb,Dev_specialist,Dev_other,RDshareVPR,HtechshareVPR,DFI_shareVPR,...,Connewcountry,ShareRD_InnProd,Share RD_TotalRD,Share_OTI,ShareFI_Exp,ShareSup_Exp,Patent,Internet,ExpNew_outCIS,ShareVRP_perCapita
0,14 Белгородская область 1618,0.24358,0.0,0.0,0.238704,0.0,0.088198,1.946667,10.766667,2.216519,...,0.025287,0.108731,0.011974,11.417417,0.0,0.016289,105.9,88.366667,0.012652,1.015018
1,15 Брянская область 1618,0.557879,0.0,0.410116,0.300684,0.0,0.0,0.243333,19.733333,0.188089,...,0.004047,0.142699,0.001581,5.766725,0.0,1.1e-05,45.833333,87.1,2e-05,0.446531
2,17 Владимирская область 1618,1.309959,0.0,0.0,0.62523,0.0,0.113856,0.33,24.7,4.034587,...,0.00688,0.2309,0.00701,8.367196,0.00971,0.026699,161.266667,89.7,0.002263,0.579015
3,20 Воронежская область 1618,0.42982,0.0,0.0,0.458222,0.546871,0.0,1.2,19.3,1.437805,...,0.008088,0.229827,0.010073,8.927655,0.0,0.037837,199.966667,86.633333,0.004089,0.632578
4,24 Ивановская область 1618,0.0,0.0,0.0,0.0,0.0,0.0,0.86,22.6,1.814584,...,0.000124,0.505126,0.000154,3.51827,0.0,0.117515,268.7,86.133333,0.0,0.382274


In [3]:
# Корректировка числовых данных
data[data.columns.difference(['Region'])] = data[data.columns.difference(['Region'])].apply(
    lambda x: x.str.replace(',', '.').astype(float)
)

In [5]:
# 1. Выбор индикаторов
selected_columns = ['Patent', 'Internet', 'ShareFI_Exp']

In [6]:
# 2. Бинаризация переменных
for col in selected_columns:
    median_value = data[col].median()
    data[f'{col}_binary'] = (data[col] >= median_value).astype(int)

In [7]:
# 3. Установка порогов отсечения
# Пороги уже установлены при бинаризации (использование медианы), дополнительные пороги не требуются.

In [8]:
# 4. Применение алгоритма Apriori
from mlxtend.frequent_patterns import apriori, association_rules

In [9]:
data_apriori = data[[f'{col}_binary' for col in selected_columns]]
frequent_itemsets = apriori(data_apriori, min_support=0.5, use_colnames=True)
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)

  and should_run_async(code)


In [10]:
# 5. Выбор переменной-следствия
# Анализируем влияние на 'ShareFI_Exp_binary'
target_variable = 'ShareFI_Exp_binary'
rules_of_interest = rules[rules['consequents'] == {target_variable}]

  and should_run_async(code)


In [35]:
# 6. Отбор полезных правил
useful_rules = rules_of_interest[(rules_of_interest['confidence'] > 0.95) & (rules_of_interest['lift'] > 0.95)]

  and should_run_async(code)


In [36]:
# 7. Интерпретация результатов
if useful_rules.empty:
    print("Не найдено значимых ассоциативных правил. Рекомендуется пересмотреть пороги или добавить другие переменные.")
else:
    print("Найдены значимые правила, которые могут указывать на взаимосвязь между технологическими инновациями и привлечением иностранных инвестиций.")

Найдены значимые правила, которые могут указывать на взаимосвязь между технологическими инновациями и привлечением иностранных инвестиций.


  and should_run_async(code)


In [37]:
useful_rules

  and should_run_async(code)


Unnamed: 0,antecedents,consequents,antecedent support,consequent support,support,confidence,lift,leverage,conviction,zhangs_metric
0,(Patent_binary),(ShareFI_Exp_binary),0.5,1.0,0.5,1.0,1.0,0.0,inf,0.0
1,(Internet_binary),(ShareFI_Exp_binary),0.5,1.0,0.5,1.0,1.0,0.0,inf,0.0


Переменные `Patent_binary` и `Internet_binary` показывают полное влияние на `ShareFI_Exp_binary`. Значение confidence равное 1.0 для обоих правил указывает, что во всех случаях, когда бинарные значения патентов и доступа в интернет выше медианы, привлечение иностранных инвестиций также выше медианы. Это подразумевает, что в регионах с высоким уровнем технологических инноваций (отражённых количеством патентов) и хорошим доступом к интернету также наблюдается высокий уровень привлечения иностранных инвестиций.

Значения lift равные 1.0 и leverage равные 0.0 для обоих правил свидетельствуют о том, что ассоциации не выходят за рамки ожидаемых. Lift 1.0 означает, что наличие или отсутствие указанных предшествующих условий не оказывает большего влияния на последствия, чем это можно было бы предположить при независимом рассмотрении.