# Электрокары
Вопрос популярности электромобилей приобретает особую актуальность в контексте их технологического развития и конкурентоспособности на автомобильном рынке. В рамках данной аналитической работы мы сосредоточимся не на сравнении двигателей внутреннего сгорания и электрических силовых установок, а на изучении предпочтений жителей различных городов США. Основное внимание будет уделено анализу того, насколько американцы склонны выбирать полностью электрические автомобили (BEV) вместо гибридных моделей (PHEV), что позволит оценить степень готовности населения к переходу на более экологичные транспортные решения.

**Цели аналитической работы:** 
- продемонстрировать навыки работы с библиотекой Pandas
- наглядно показать преобладание опредленного типа машин (BEV или PHEV)
- посмотреть выборку из нескольких городов западного побережъя, и определить соотношение машин с различным типом двигателя.

**Ход исследования:**
Данные для исследования я взял из открытого источника баз данных США(https://catalog.data.gov/dataset/electric-vehicle-population-data). База данных была обновленна 14 марта 2025, что позволит судить о достоверности информации. 
Исследование пройдёт в три этапа:
1. Обзор данных
2. Предобработка данных
3. Вывод исследования

# Обзор данных

Составим первое представление о данных по электромобилям


In [None]:
При помощи команды импортируем библотеку Pandas

In [28]:
import pandas as pd


Прочитаем файл elcar.csv и сохраним его в переменной df:

In [30]:
df = pd.read_csv('elcar.csv')

Просмотрим первые 10 строк данных elcar.csv 

In [31]:
df.head(10)

Unnamed: 0,VIN (1-10),County,City,State,Postal Code,Model Year,Make,Model,Electric Vehicle Type,Clean Alternative Fuel Vehicle (CAFV) Eligibility,Electric Range,Base MSRP,Legislative District,DOL Vehicle ID,Vehicle Location,Electric Utility,2020 Census Tract
0,5YJ3E1EBXK,King,Seattle,WA,98178.0,2019,TESLA,MODEL 3,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,220.0,0.0,37.0,477309682,POINT (-122.23825 47.49461),CITY OF SEATTLE - (WA)|CITY OF TACOMA - (WA),53033010000.0
1,5YJYGDEE3L,Kitsap,Poulsbo,WA,98370.0,2020,TESLA,MODEL Y,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,291.0,0.0,23.0,109705683,POINT (-122.64681 47.73689),PUGET SOUND ENERGY INC,53035090000.0
2,KM8KRDAF5P,Kitsap,Olalla,WA,98359.0,2023,HYUNDAI,IONIQ 5,Battery Electric Vehicle (BEV),Eligibility unknown as battery range has not b...,0.0,0.0,26.0,230390492,POINT (-122.54729 47.42602),PUGET SOUND ENERGY INC,53035090000.0
3,5UXTA6C0XM,Kitsap,Seabeck,WA,98380.0,2021,BMW,X5,Plug-in Hybrid Electric Vehicle (PHEV),Clean Alternative Fuel Vehicle Eligible,30.0,0.0,35.0,267929112,POINT (-122.81585 47.64509),PUGET SOUND ENERGY INC,53035090000.0
4,JTMAB3FV7P,Thurston,Rainier,WA,98576.0,2023,TOYOTA,RAV4 PRIME,Plug-in Hybrid Electric Vehicle (PHEV),Clean Alternative Fuel Vehicle Eligible,42.0,0.0,2.0,236505139,POINT (-122.68993 46.88897),PUGET SOUND ENERGY INC,53067010000.0
5,5YJSA1DN0C,Thurston,Olympia,WA,98502.0,2012,TESLA,MODEL S,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,265.0,59900.0,22.0,186637195,POINT (-122.92333 47.03779),PUGET SOUND ENERGY INC,53067010000.0
6,WBY1Z6C30H,King,Bellevue,WA,98004.0,2017,BMW,I3,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,81.0,0.0,48.0,196789610,POINT (-122.1872 47.61001),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),53033020000.0
7,3MW5P9J0XN,Snohomish,Marysville,WA,98271.0,2022,BMW,330E,Plug-in Hybrid Electric Vehicle (PHEV),Not eligible due to low battery range,22.0,0.0,39.0,204822761,POINT (-122.1677 48.11026),PUGET SOUND ENERGY INC,53061050000.0
8,5YJ3E1EA6J,King,Kirkland,WA,98034.0,2018,TESLA,MODEL 3,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,215.0,0.0,45.0,2039222,POINT (-122.22901 47.72201),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),53033020000.0
9,5YJ3E1EA2J,King,Redmond,WA,98052.0,2018,TESLA,MODEL 3,Battery Electric Vehicle (BEV),Clean Alternative Fuel Vehicle Eligible,215.0,0.0,45.0,474817283,POINT (-122.13158 47.67858),PUGET SOUND ENERGY INC||CITY OF TACOMA - (WA),53033030000.0


Получим полную инофрмацию о базе данных. В частности нас интересуют названи колонок, тип данных в колонках. 

In [20]:
df.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 235692 entries, 0 to 235691
Data columns (total 17 columns):
 #   Column                                             Non-Null Count   Dtype  
---  ------                                             --------------   -----  
 0   VIN (1-10)                                         235692 non-null  object 
 1   County                                             235689 non-null  object 
 2   City                                               235689 non-null  object 
 3   State                                              235692 non-null  object 
 4   Postal Code                                        235689 non-null  float64
 5   Model Year                                         235692 non-null  int64  
 6   Make                                               235692 non-null  object 
 7   Model                                              235692 non-null  object 
 8   Electric Vehicle Type                              235692 non-null  object

Проверим количество пропусков, по необходимым нам колонкам, чтобы в последствии исключить повторяющиеся значения.

In [21]:
df.isna().sum()

VIN (1-10)                                             0
County                                                 3
City                                                   3
State                                                  0
Postal Code                                            3
Model Year                                             0
Make                                                   0
Model                                                  0
Electric Vehicle Type                                  0
Clean Alternative Fuel Vehicle (CAFV) Eligibility      0
Electric Range                                        36
Base MSRP                                             36
Legislative District                                 494
DOL Vehicle ID                                         0
Vehicle Location                                      10
Electric Utility                                       3
2020 Census Tract                                      3
dtype: int64

После получения повторяющихся данных. Выберм необходимые нам колонки для исследования, и оставим их в таблице.

In [22]:
df = df[['City', 'Make', 'Electric Vehicle Type', 'Model' ]]

# Переработка данных
После всех проведенных действия. Таблица приняла необходимый нам вид для фильтрации. Для этого создадим фильтр по названию города, чтобы при выводе информации нам показывало количство строк с названием типа двигателя.
Для наглядности выберем два города США, чтобы один из них был южнее другой северней. Первый город который мы вберем будет Los Angeles, так как он наиболле подходит для точности измерений. И вторым городом выберем Сиетлл.
При помощи фильра по названию в колоке City, выведем количстево строк с BEV и PHEV двигателей.

In [26]:
city_filter = 'Los Angeles'
filtered_df = df[df['City'] == city_filter]
result = filtered_df['Electric Vehicle Type'].value_counts()
print(f"Количество строк для города {city_filter} по типам Electric Vehicle Type:")
print(result)

Количество строк для города Kent по типам Electric Vehicle Type:
Electric Vehicle Type
Battery Electric Vehicle (BEV)            3382
Plug-in Hybrid Electric Vehicle (PHEV)     633
Name: count, dtype: int64


In [27]:
city_filter = 'Seattle'
filtered_df = df[df['City'] == city_filter]
result = filtered_df['Electric Vehicle Type'].value_counts()
print(f"Количество строк для города {city_filter} по типам Electric Vehicle Type:")
print(result)

Количество строк для города Seattle по типам Electric Vehicle Type:
Electric Vehicle Type
Battery Electric Vehicle (BEV)            29965
Plug-in Hybrid Electric Vehicle (PHEV)     7445
Name: count, dtype: int64


Таким образом по выборке из двух городов можно сказать, что соотношение гибридных двигателей будет от 15 до 20 процентов. 

# Выводы
По итогом данной работы удалось закрепить навыки работы с Pandas. Было видно, что наиболее преобладающий тип двигатлей BEV, так как США озабочены эколочиеской повесткой. Так же можно предположить что в среднем машины с типом PHEV, в среднем преобладают от 15 до 20 процентов. Но чтобы данные были максимально точны необходимо взять выборку из большего количества городов. 
Таким образом **все цели аналитической работы были достигнуты**. Пострался макимально подробно описать работу с pandas и сделать выводы исходя из таблицы данных. 
