# Обнаружение мошенничества с кредитными картами

### Содержание
* Введение: Обнаружение мошенничества с кредитными картами
* Описание данных
* Формулировка исследовательского вопроса
* Подготовка данных: очистка и формирование

## 1. Введение: Обнаружение мошенничества с кредитными картами

В эпоху цифровизации банковские карты стали неотъемлемой частью повседневной жизни миллионов людей. Однако, параллельно с этим ростом популярности, возросла и угроза мошенничества. Недобросовестные действия злоумышленников могут привести к серьезным финансовым потерям как для отдельных лиц, так и для банков и финансовых учреждений в целом.

Для эффективного противостояния мошенничеству необходима разработка высокоточных алгоритмов и моделей, способных автоматически выявлять потенциально мошеннические транзакции. Основной целью представленного набора данных является облегчение этого процесса. На основе собранных статистических данных о транзакциях, предоставленных в этом наборе, можно разработать и усовершенствовать алгоритмы, обученные распознавать аномалии и выделять те транзакции, которые требуют дополнительной проверки.

Этот набор данных представляет собой важный инструмент в борьбе с финансовыми мошенничествами и способствует созданию более надежной и безопасной среды для пользователей банковских карт.

## 2. Описание данных



Этот набор данных включает транзакции по кредитным картам, совершенные владельцами карт в течение 2023 года. Имея более 550 000 анонимных записей, он служит ценным ресурсом для разработки алгоритмов и моделей обнаружения мошенничества. Набор данных включает в себя различные анонимизированные атрибуты транзакции, такие как время, местоположение, категория продавца и тип транзакции. Каждая транзакция помечается как мошенническая (1) или немошенническая (0), что делает ее идеальным набором данных для обучения и оценки систем обнаружения мошенничества. Источник данных не разглашается в целях защиты приватности и конфиденциальности.

id: уникальный идентификатор для каждой транзакции.
V1–V28: анонимизированные функции, представляющие различные атрибуты транзакции (например, время, местоположение и т. д.).
Amount: Сумма транзакции
Class: двоичная метка, указывающая, является ли транзакция мошеннической (1) или нет (0).

## 3. Формулировка исследовательского вопроса

Эти вопросы могут помочь нам глубже понять характеристики данных и разработать более эффективные модели для обнаружения мошенничества с банковскими картами.

1. Какие атрибуты транзакций оказывают наибольшее влияние на вероятность мошенничества с банковскими картами в предоставленном наборе данных?

2. Какова частота совершения мошеннических транзакций среди всех транзакций в наборе данных, и как она меняется в зависимости от времени и категории продавца?

3. Существует ли явные временные или местоположенные паттерны, связанные с мошенническими транзакциями с банковскими картами в течение 2023 года?

4. Какие характеристики мошеннических транзакций существенно отличаются от немошеннических?

5. Можно ли выделить подгруппы держателей банковских карт, у которых вероятность мошенничества выше средней, и если да, то какие особенности характеризуют эти группы?

## 4. Подготовка данных: очистка и формирование



### Reading the Data

In [6]:
import pandas as pd
df = pd.read_csv('creditcard_2023.csv')
df = df.drop_duplicates()

In [9]:
df = pd.read_csv('creditcard_2023.csv')

In [10]:
df.describe()

Unnamed: 0,id,V1,V2,V3,V4,V5,V6,V7,V8,V9,V10,V11,V12,V13,V14,V15,V16,V17,V18,V19,V20,V21,V22,V23,V24,V25,V26,V27,V28,Amount,Class
count,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5523.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0,5522.0
mean,2761.0,0.270946,-0.381409,1.086893,-0.713475,0.320483,0.535976,0.487582,-0.150467,0.785077,0.622703,-0.484248,0.581738,0.400627,1.006243,0.177708,0.545415,0.52017,0.308944,-0.234746,-0.115158,-0.123893,-0.163925,-0.057962,0.198024,0.080163,-0.175198,-0.183468,-0.090205,11967.629232,0.000543
std,1594.497099,0.584351,0.439502,0.673002,0.713086,0.530727,0.720897,0.613963,0.223725,0.740326,0.608854,0.614774,0.69843,1.203428,0.63252,1.008825,0.535211,0.30252,0.522727,0.691495,0.563479,0.294703,0.569653,0.363857,1.15865,0.659741,1.109312,0.393465,0.608938,6944.013612,0.023304
min,0.0,-1.627748,-8.544918,-1.420525,-3.996094,-4.29832,-4.816992,-1.50023,-4.07435,-0.968912,-0.877006,-2.995759,-0.989158,-3.434314,-0.86377,-3.609738,-0.861398,-0.607564,-1.202553,-4.821165,-14.722508,-5.670307,-4.363603,-6.620316,-3.674306,-3.523117,-3.733169,-5.273815,-7.262726,50.53,0.0
25%,1380.5,-0.161052,-0.548126,0.623192,-1.094699,0.040954,0.066008,0.282517,-0.195155,0.322179,0.370825,-0.868214,-0.051505,-0.410531,0.593767,-0.511001,0.162505,0.318453,-0.021461,-0.623222,-0.30183,-0.205531,-0.566201,-0.211892,-0.585985,-0.320298,-0.98722,-0.291929,-0.142503,5948.2075,0.0
50%,2761.0,0.029336,-0.332813,0.988774,-0.574781,0.222979,0.384473,0.45142,-0.143738,0.702205,0.532759,-0.385788,0.608017,0.321354,0.831914,0.245832,0.470725,0.458083,0.253174,-0.200082,-0.155133,-0.144708,-0.203061,-0.072063,0.228911,0.096257,-0.180308,-0.217388,-0.053296,11739.31,0.0
75%,4141.5,0.927347,-0.151683,1.471931,-0.202007,0.437547,0.79869,0.650686,-0.073741,1.091226,0.726184,-0.033381,1.047092,1.223647,1.361485,0.874871,0.833514,0.643264,0.559331,0.232332,0.019539,-0.076802,0.217044,0.063757,0.941737,0.504919,0.560003,-0.04567,0.096137,18009.06,0.0
max,5522.0,1.423966,1.20119,4.440555,1.170756,8.773367,9.295606,37.922674,0.851832,10.579235,12.506699,0.976902,6.109411,3.848219,5.53628,5.078341,5.596853,2.838944,3.458424,2.141955,6.638245,4.868825,4.7601,4.778495,8.395836,3.395676,5.555557,6.550638,11.030108,24033.59,1.0
