In [129]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Техническое задание

Цель: Исследование ценовой ситуации на рынке продажи земельных участков, ценовая сегментация рынка.
Объект и предмет исследования: Уровень цен продажи земельных участков под строительство индивидуального жилого дома и коммерческого объекта.

1-этап сбор, анализ и генерация данных.
Инструменты: excel, python, Qgis (или любая другая GIS система для разметки географических данных, GIS система должна поддерживать export/import данных в .shp файлы), PowerPoint, открытые источники данных

Задачи:
1.	Собрать данные по продажам земельных участков из открытых источников по Чуйской области.

2.	Провести анализ данных, основанный на географическом расположении земельного участка с помощью GIS систем:
a.	Разметить центральные улицы области,
b.	Отметить точки притяжения цен (близость к точкам влияет на стоимость земельного участка), к примеру, базары, административные здания и др. по вашему усмотрению.
c.	Создать ценовые зоны. Подсказка: (Рассматривать село как целую географическую единицу, которую можно анализировать. Города в свою очередь разбивать по ценовым сегментам, не менее 15 ценовых сегментов).
и показать их влияние на ценообразование земельных участков (графики, кф. Пирсона и т.д.), чем больше территории будет покрыто, тем лучше.

3.	Провести анализ данных, чтобы выявить остальные факторы, влияющие на стоимость земельных участков. Например: стоимость одного земельного участка при прочих равных условиях выше другого, т.к. назначение данного участка – под коммерцию. Пример с формой и обязательными полями для заполнения данными:


Примечание: факторов, влияющих на стоимость, может быть больше, количество полей в этом случае должно дополняться.

4.	В случае недостачи данных, придумать статистически обоснованный метод по генерации дополнительных данных (село – 30 рядов, город на каждую ценовую зону – 15 рядов), исходя из результатов анализа ценообразующих факторов реальных рядов.

Результат:
Размеченные в GIS системе: центральные улицы, точки притяжения цен, ценовые зоны. Файл xlsx или csv с найденными/сгенерированными данными. Графики, аналитические методы, наглядно демонстрирующие влияние географических и др. факторов на ценообразование (линейные, нелинейные зависимости и т.д.)


In [130]:
data = pd.read_csv("sample_data/houses.csv")

In [131]:
data.head(50)

Unnamed: 0.1,Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Коммуникации,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,...,Кол-во этажей,Интернет,Канализация,Питьевая вода,Электричество,Газ,Мебель,Телефон,Санузел,Пол
0,0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",$ 37 000,от собственника,4.11 соток,"свет, ...","договор купли-продажи, ...",есть,обмен на авто,42.8388,...,,,,,,,,,,
1,1,"с. Кок-Джар, Вишневая 26",$ 30 000,от собственника,4 соток,"вода, ...","договор купли-продажи, ...",нет,обмен не предлагать,42.7882,...,,,,,,,,,,
2,2,Кант,$ 980 000,от собственника,140 соток,"свет, ...",красная книга,,,42.8858,...,,,,,,,,,,
3,3,"с. Военно-Антоновка, Октябрьская/Проектируемая",$ 12 000,от собственника,4 соток,свет,"договор купли-продажи, ...",нет,,42.8582,...,,,,,,,,,,
4,4,с. Кош-Коль,$ 65 000,от собственника,100 соток,,красная книга,,рассмотрю варианты,42.5419,...,,,,,,,,,,
5,5,"Бишкек, 1-линия -",$ 28 000,от собственника,6 соток,свет,"договор купли-продажи, ...",,,42.827,...,,,,,,,,,,
6,6,"с. Туз, ул. А. Дербишева 26",$ 18 000,от собственника,13 соток,,,,,42.7898,...,,,,,,,,,,
7,7,Чолпон-Ата,$ 12 000,от собственника,10 соток,вода,зеленая книга,,,42.6459,...,,,,,,,,,,
8,8,"Бишкек, Кузнечная крепость, Жибек-Жолу 367",$ 190 000,от собственника,5 соток,свет,"договор купли-продажи, ...",нет,,42.8855,...,,,,,,,,,,
9,9,"Бишкек, Таатан",$ 320 000,от агента,19 соток,"свет, ...",,,,42.8803,...,,,,,,,,,,


In [132]:
data.shape

(847, 25)

In [133]:
data.columns

Index(['Unnamed: 0', 'Адрес', 'Цена', 'Тип предложения', 'Площадь участка',
       'Коммуникации', 'Правоустанавливающие документы', 'Возможность ипотеки',
       'Возможность обмена', 'Широта', 'Долгота', 'Местоположение', 'Разное',
       'Возможность рассрочки', 'Состояние', 'Кол-во этажей', 'Интернет',
       'Канализация', 'Питьевая вода', 'Электричество', 'Газ', 'Мебель',
       'Телефон', 'Санузел', 'Пол'],
      dtype='object')

In [134]:
data = data.drop('Unnamed: 0', axis=1)

In [135]:
data['Площадь участка'] = data['Площадь участка'].str.replace('соток', '')
data['Возможность ипотеки'] = data['Возможность ипотеки'].replace({'нет': 0, 'есть': 1})
data.head()

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Коммуникации,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,...,Кол-во этажей,Интернет,Канализация,Питьевая вода,Электричество,Газ,Мебель,Телефон,Санузел,Пол
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",$ 37 000,от собственника,4.11,"свет, ...","договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,...,,,,,,,,,,
1,"с. Кок-Джар, Вишневая 26",$ 30 000,от собственника,4.0,"вода, ...","договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,...,,,,,,,,,,
2,Кант,$ 980 000,от собственника,140.0,"свет, ...",красная книга,,,42.8858,74.817,...,,,,,,,,,,
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",$ 12 000,от собственника,4.0,свет,"договор купли-продажи, ...",0.0,,42.8582,74.4477,...,,,,,,,,,,
4,с. Кош-Коль,$ 65 000,от собственника,100.0,,красная книга,,рассмотрю варианты,42.5419,76.6252,...,,,,,,,,,,


In [136]:
data.isnull().sum()

Адрес                               0
Цена                                0
Тип предложения                     0
Площадь участка                     0
Коммуникации                      412
Правоустанавливающие документы    391
Возможность ипотеки               631
Возможность обмена                560
Широта                              0
Долгота                             0
Местоположение                    526
Разное                            489
Возможность рассрочки             694
Состояние                         839
Кол-во этажей                     797
Интернет                          846
Канализация                       845
Питьевая вода                     845
Электричество                     845
Газ                               845
Мебель                            845
Телефон                           846
Санузел                           846
Пол                               846
dtype: int64

In [137]:
data["Коммуникации"]

0      свет,                                         ...
1      вода,                                         ...
2      свет,                                         ...
3                                                   свет
4                                                    NaN
                             ...                        
842    свет,                                         ...
843    свет,                                         ...
844    свет,                                         ...
845    свет,                                         ...
846                                                  NaN
Name: Коммуникации, Length: 847, dtype: object

In [138]:
data['Cвет'] = data['Коммуникации'].str.contains('свет', case=False, na=False).astype(int)
data['Интернет'] = data['Коммуникации'].str.contains('интернет', case=False, na=False).astype(int)
data['Канализация'] = data['Коммуникации'].str.contains('канализация', case=False, na=False).astype(int)
data['Питьевая вода'] = data['Коммуникации'].str.contains('вода', case=False, na=False).astype(int)
data['Электричество'] = data['Коммуникации'].str.contains('электричество', case=False, na=False).astype(int)
data['Газ'] = data['Коммуникации'].str.contains('газ', case=False, na=False).astype(int)
data['Мебель'] = data['Коммуникации'].str.contains('мебель', case=False, na=False).astype(int)
data['Санузел'] = data['Коммуникации'].str.contains('санузел', case=False, na=False).astype(int)
data['Пол'] = data['Коммуникации'].str.contains('пол', case=False, na=False).astype(int)
data.head()

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Коммуникации,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,...,Интернет,Канализация,Питьевая вода,Электричество,Газ,Мебель,Телефон,Санузел,Пол,Cвет
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",$ 37 000,от собственника,4.11,"свет, ...","договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,...,0,1,1,0,1,0,,0,0,1
1,"с. Кок-Джар, Вишневая 26",$ 30 000,от собственника,4.0,"вода, ...","договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,...,0,1,1,0,0,0,,0,0,0
2,Кант,$ 980 000,от собственника,140.0,"свет, ...",красная книга,,,42.8858,74.817,...,0,0,1,0,0,0,,0,0,1
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",$ 12 000,от собственника,4.0,свет,"договор купли-продажи, ...",0.0,,42.8582,74.4477,...,0,0,0,0,0,0,,0,0,1
4,с. Кош-Коль,$ 65 000,от собственника,100.0,,красная книга,,рассмотрю варианты,42.5419,76.6252,...,0,0,0,0,0,0,,0,0,0


In [139]:
data = data.drop("Телефон", axis=1)

In [140]:
data.isnull().sum()

Адрес                               0
Цена                                0
Тип предложения                     0
Площадь участка                     0
Коммуникации                      412
Правоустанавливающие документы    391
Возможность ипотеки               631
Возможность обмена                560
Широта                              0
Долгота                             0
Местоположение                    526
Разное                            489
Возможность рассрочки             694
Состояние                         839
Кол-во этажей                     797
Интернет                            0
Канализация                         0
Питьевая вода                       0
Электричество                       0
Газ                                 0
Мебель                              0
Санузел                             0
Пол                                 0
Cвет                                0
dtype: int64

In [141]:
data['Коммуникации'] = data['Коммуникации'].astype(str)
longest_string = max(data['Коммуникации'], key=len, default='')

result_list = [longest_string, len(longest_string)]
print("Longest string in 'Коммуникации':", result_list)


Longest string in 'Коммуникации': ['свет,                                             газ,                                             интернет,                                             отопление,                                             вода,                                             телефон,                                             канализация', 322]


In [142]:
data['Отопление'] = data['Коммуникации'].str.contains('отопление', case=False, na=False).astype(int)

In [143]:
data.isnull().sum()

Адрес                               0
Цена                                0
Тип предложения                     0
Площадь участка                     0
Коммуникации                        0
Правоустанавливающие документы    391
Возможность ипотеки               631
Возможность обмена                560
Широта                              0
Долгота                             0
Местоположение                    526
Разное                            489
Возможность рассрочки             694
Состояние                         839
Кол-во этажей                     797
Интернет                            0
Канализация                         0
Питьевая вода                       0
Электричество                       0
Газ                                 0
Мебель                              0
Санузел                             0
Пол                                 0
Cвет                                0
Отопление                           0
dtype: int64

In [144]:
unique_values_list = data["Возможность обмена"].unique().tolist()

print("Unique values in 'Возможность обмена' as a list:", unique_values_list)

Unique values in 'Возможность обмена' as a list: ['обмен на авто', 'обмен не предлагать', nan, 'рассмотрю варианты', 'с доплатой покупателя', 'ключ на ключ']


In [145]:
data.dtypes

Адрес                              object
Цена                               object
Тип предложения                    object
Площадь участка                    object
Коммуникации                       object
Правоустанавливающие документы     object
Возможность ипотеки               float64
Возможность обмена                 object
Широта                            float64
Долгота                           float64
Местоположение                     object
Разное                             object
Возможность рассрочки              object
Состояние                          object
Кол-во этажей                     float64
Интернет                            int32
Канализация                         int32
Питьевая вода                       int32
Электричество                       int32
Газ                                 int32
Мебель                              int32
Санузел                             int32
Пол                                 int32
Cвет                              

In [146]:
data["Площадь участка"] = pd.to_numeric(data["Площадь участка"], errors='coerce').astype('Float64')

In [147]:
data["Площадь, кв.м"] = data["Площадь участка"]*100
data.head()

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Коммуникации,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,...,Канализация,Питьевая вода,Электричество,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м"
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",$ 37 000,от собственника,4.11,"свет, ...","договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,...,1,1,0,1,0,0,0,1,0,411.0
1,"с. Кок-Джар, Вишневая 26",$ 30 000,от собственника,4.0,"вода, ...","договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,...,1,1,0,0,0,0,0,0,0,400.0
2,Кант,$ 980 000,от собственника,140.0,"свет, ...",красная книга,,,42.8858,74.817,...,0,1,0,0,0,0,0,1,0,14000.0
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",$ 12 000,от собственника,4.0,свет,"договор купли-продажи, ...",0.0,,42.8582,74.4477,...,0,0,0,0,0,0,0,1,0,400.0
4,с. Кош-Коль,$ 65 000,от собственника,100.0,,красная книга,,рассмотрю варианты,42.5419,76.6252,...,0,0,0,0,0,0,0,0,0,10000.0


In [148]:
data = data.drop("Коммуникации", axis=1)

In [149]:
data.columns

Index(['Адрес', 'Цена', 'Тип предложения', 'Площадь участка',
       'Правоустанавливающие документы', 'Возможность ипотеки',
       'Возможность обмена', 'Широта', 'Долгота', 'Местоположение', 'Разное',
       'Возможность рассрочки', 'Состояние', 'Кол-во этажей', 'Интернет',
       'Канализация', 'Питьевая вода', 'Электричество', 'Газ', 'Мебель',
       'Санузел', 'Пол', 'Cвет', 'Отопление', 'Площадь, кв.м'],
      dtype='object')

In [150]:
unique_values_list = data["Правоустанавливающие документы"].unique().tolist()
unique_values_list = [str(i).strip() if isinstance(i, str) else i for i in unique_values_list]
print("Unique values in 'Правоустанавливающие документы' as a list:", [i for i in unique_values_list])


Unique values in 'Правоустанавливающие документы' as a list: ['договор купли-продажи,                                             красная книга', 'договор купли-продажи,                                             технический паспорт,                                             красная книга', 'красная книга', nan, 'зеленая книга', 'технический паспорт,                                             красная книга', 'договор купли-продажи,                                             технический паспорт,                                             акт ввода в эксплуатацию,                                             красная книга', 'красная книга,                                             акт ввода в эксплуатацию,                                             технический паспорт,                                             договор купли-продажи', 'красная книга,                                             технический паспорт', 'технический паспорт,                                           

In [153]:
# Assuming data is your DataFrame
data['Цена'] = data['Цена'].str.replace('$ ', '').apply(lambda x: int("".join(x.split())))
data

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,Местоположение,...,Канализация,Питьевая вода,Электричество,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м"
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",37000,от собственника,4.11,"договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,,...,1,1,0,1,0,0,0,1,0,411.0
1,"с. Кок-Джар, Вишневая 26",30000,от собственника,4.0,"договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,в предгорьях,...,1,1,0,0,0,0,0,0,0,400.0
2,Кант,980000,от собственника,140.0,красная книга,,,42.8858,74.8170,,...,0,1,0,0,0,0,0,1,0,14000.0
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",12000,от собственника,4.0,"договор купли-продажи, ...",0.0,,42.8582,74.4477,в городе,...,0,0,0,0,0,0,0,1,0,400.0
4,с. Кош-Коль,65000,от собственника,100.0,красная книга,,рассмотрю варианты,42.5419,76.6252,,...,0,0,0,0,0,0,0,0,0,10000.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
842,"Бишкек, Карпинка, Карпинка 125/Огонбаева",800000,от собственника,20.0,красная книга,0.0,рассмотрю варианты,42.8792,74.6232,в городе,...,1,1,0,1,0,0,0,1,0,2000.0
843,"с. Верхний Орок, Коновалова 53",60000,от собственника,14.0,"технический паспорт, ...",0.0,,42.8075,74.5216,в предгорьях,...,0,1,0,0,0,0,0,1,0,1400.0
844,"с. Тамчы, Манас 23/Има баяманова",135000,от собственника,120.0,,,,42.5631,76.6506,вдоль трассы,...,0,1,0,0,0,0,0,1,0,12000.0
845,"Бишкек, достук 76/тайлак батыр",34500,от собственника,4.0,,,,42.8247,74.5024,в городе,...,0,1,0,0,0,0,0,1,0,400.0


In [154]:
data["Стоимость, доллар США за 1 кв.м"] = data["Цена"]/data["Площадь, кв.м"]
data.head()

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,Местоположение,...,Питьевая вода,Электричество,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м","Стоимость, доллар США за 1 кв.м"
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",37000,от собственника,4.11,"договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,,...,1,0,1,0,0,0,1,0,411.0,90.024331
1,"с. Кок-Джар, Вишневая 26",30000,от собственника,4.0,"договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,в предгорьях,...,1,0,0,0,0,0,0,0,400.0,75.0
2,Кант,980000,от собственника,140.0,красная книга,,,42.8858,74.817,,...,1,0,0,0,0,0,1,0,14000.0,70.0
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",12000,от собственника,4.0,"договор купли-продажи, ...",0.0,,42.8582,74.4477,в городе,...,0,0,0,0,0,0,1,0,400.0,30.0
4,с. Кош-Коль,65000,от собственника,100.0,красная книга,,рассмотрю варианты,42.5419,76.6252,,...,0,0,0,0,0,0,0,0,10000.0,6.5


In [158]:
for i in range(10):
    print(i, data["Адрес"][i])

0 Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муромская
1 с. Кок-Джар, Вишневая 26
2 Кант
3 с. Военно-Антоновка, Октябрьская/Проектируемая
4 с. Кош-Коль
5 Бишкек, 1-линия -
6 с. Туз,  ул. А. Дербишева 26
7 Чолпон-Ата
8 Бишкек, Кузнечная крепость, Жибек-Жолу 367
9 Бишкек, Таатан


In [159]:
data['Город'] = data['Адрес'].str.split(',').str.get(0)

In [161]:
unique_values_list = data["Тип предложения"].unique().tolist()

print("Unique values in 'Тип предложения' as a list:", unique_values_list)

Unique values in 'Тип предложения' as a list: ['от собственника', 'от агента']


In [162]:
data["Тип предложения"] = data["Тип предложения"].replace({"от собственника": "собственник", "от агента": "агент"})
data[:10]

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,Местоположение,...,Электричество,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м","Стоимость, доллар США за 1 кв.м",Город
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",37000,собственник,4.11,"договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,,...,0,1,0,0,0,1,0,411.0,90.024331,Бишкек
1,"с. Кок-Джар, Вишневая 26",30000,собственник,4.0,"договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,в предгорьях,...,0,0,0,0,0,0,0,400.0,75.0,с. Кок-Джар
2,Кант,980000,собственник,140.0,красная книга,,,42.8858,74.817,,...,0,0,0,0,0,1,0,14000.0,70.0,Кант
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",12000,собственник,4.0,"договор купли-продажи, ...",0.0,,42.8582,74.4477,в городе,...,0,0,0,0,0,1,0,400.0,30.0,с. Военно-Антоновка
4,с. Кош-Коль,65000,собственник,100.0,красная книга,,рассмотрю варианты,42.5419,76.6252,,...,0,0,0,0,0,0,0,10000.0,6.5,с. Кош-Коль
5,"Бишкек, 1-линия -",28000,собственник,6.0,"договор купли-продажи, ...",,,42.827,74.488,в городе,...,0,0,0,0,0,1,0,600.0,46.666667,Бишкек
6,"с. Туз, ул. А. Дербишева 26",18000,собственник,13.0,,,,42.7898,74.8535,,...,0,0,0,0,0,0,0,1300.0,13.846154,с. Туз
7,Чолпон-Ата,12000,собственник,10.0,зеленая книга,,,42.6459,77.052,,...,0,0,0,0,0,0,0,1000.0,12.0,Чолпон-Ата
8,"Бишкек, Кузнечная крепость, Жибек-Жолу 367",190000,собственник,5.0,"договор купли-продажи, ...",0.0,,42.8855,74.6179,в городе,...,0,0,0,0,0,1,0,500.0,380.0,Бишкек
9,"Бишкек, Таатан",320000,агент,19.0,,,,42.8803,74.6523,в городе,...,0,1,0,0,0,1,0,1900.0,168.421053,Бишкек


In [164]:
unique_values_list = data["Город"].unique().tolist()

print("Unique values in 'Город' as a list:", unique_values_list)
print(len(unique_values_list))

Unique values in 'Город' as a list: ['Бишкек', 'с. Кок-Джар', 'Кант', 'с. Военно-Антоновка', 'с. Кош-Коль', 'с. Туз', 'Чолпон-Ата', 'с. Новопавловка', 'с. Ананьево', 'с. Октябрьское (Аламудунский р-н)', 'с. Токбай', 'с. Беш-Кунгей', 'с. Арашан', 'с. им. С. Чокморова', 'с. Аламудун', 'с. Маловодное (Московский р-н)', 'с. Лесное (Сокулукский р-н)', 'с. Сретенка', 'с. Бостери', 'с. Заречное', 'с. Новопокровка', 'с. Байтик', 'с. Малиновка', 'с. Кой-Таш', 'с. Кара-Талаа', 'с. Садовое (Аламудунский р-н)', 'с. Дача СУ', 'с. Кашка-Суу', 'с. Таш-Добо', 'Джалал-Абад', 'с. Маевка', 'Лебединовка', 'Сокулук', 'с. Садовое (Московский р-н)', 'с. Шалта', 'с. Семёновка', 'дп "Строитель"', 'Токмок', 'Каракол', 'с. Ленинское', 'с. им. Фрунзе', 'с. Тамчы', 'с. Кызыл-Туу', 'с. Бар-Булак', 'с. Корумду (Иссык-Кульский р-н)', 'с. Ивановка', 'с. Пригородное', 'с. Чат-Кель', 'с. Горная Маевка', 'с. Булан-Соготту', 'с. Орнок', 'с. Чок-Тал', 'с. Григорьевская пристань', 'с. Кара-Ой', 'с. Темировка', 'с. Кичи-Орук

In [170]:
data.head(10)

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,Местоположение,...,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м","Стоимость, доллар США за 1 кв.м",Город,Село
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",37000,собственник,4.11,"договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,,...,1,0,0,0,1,0,411.0,90.024331,Бишкек,False
1,"с. Кок-Джар, Вишневая 26",30000,собственник,4.0,"договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,в предгорьях,...,0,0,0,0,0,0,400.0,75.0,с. Кок-Джар,False
2,Кант,980000,собственник,140.0,красная книга,,,42.8858,74.817,,...,0,0,0,0,1,0,14000.0,70.0,Кант,False
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",12000,собственник,4.0,"договор купли-продажи, ...",0.0,,42.8582,74.4477,в городе,...,0,0,0,0,1,0,400.0,30.0,с. Военно-Антоновка,False
4,с. Кош-Коль,65000,собственник,100.0,красная книга,,рассмотрю варианты,42.5419,76.6252,,...,0,0,0,0,0,0,10000.0,6.5,с. Кош-Коль,False
5,"Бишкек, 1-линия -",28000,собственник,6.0,"договор купли-продажи, ...",,,42.827,74.488,в городе,...,0,0,0,0,1,0,600.0,46.666667,Бишкек,False
6,"с. Туз, ул. А. Дербишева 26",18000,собственник,13.0,,,,42.7898,74.8535,,...,0,0,0,0,0,0,1300.0,13.846154,с. Туз,False
7,Чолпон-Ата,12000,собственник,10.0,зеленая книга,,,42.6459,77.052,,...,0,0,0,0,0,0,1000.0,12.0,Чолпон-Ата,False
8,"Бишкек, Кузнечная крепость, Жибек-Жолу 367",190000,собственник,5.0,"договор купли-продажи, ...",0.0,,42.8855,74.6179,в городе,...,0,0,0,0,1,0,500.0,380.0,Бишкек,False
9,"Бишкек, Таатан",320000,агент,19.0,,,,42.8803,74.6523,в городе,...,1,0,0,0,1,0,1900.0,168.421053,Бишкек,False


In [171]:
unique_values_list = data["Местоположение"].unique().tolist()

print("Unique values in 'Местоположение' as a list:", unique_values_list)

Unique values in 'Местоположение' as a list: [nan, 'в предгорьях', 'в городе', 'в пригороде', 'в дачном массиве', 'вдоль трассы', 'возле водоема']


In [172]:
data["Местоположение"] = data["Местоположение"].replace({"в предгорьях": "предгорье", "в городе": "город", "в пригороде": "пригород", "в дачном массиве": "дача", "вдоль трассы":"трасса", "возле водоема":"водоем"})
data[:10]

Unnamed: 0,Адрес,Цена,Тип предложения,Площадь участка,Правоустанавливающие документы,Возможность ипотеки,Возможность обмена,Широта,Долгота,Местоположение,...,Газ,Мебель,Санузел,Пол,Cвет,Отопление,"Площадь, кв.м","Стоимость, доллар США за 1 кв.м",Город,Село
0,"Бишкек, Ак-Орго ж/м, Омур, (Кипкалова) 20/Муро...",37000,собственник,4.11,"договор купли-продажи, ...",1.0,обмен на авто,42.8388,74.5233,,...,1,0,0,0,1,0,411.0,90.024331,Бишкек,False
1,"с. Кок-Джар, Вишневая 26",30000,собственник,4.0,"договор купли-продажи, ...",0.0,обмен не предлагать,42.7882,74.6647,предгорье,...,0,0,0,0,0,0,400.0,75.0,с. Кок-Джар,False
2,Кант,980000,собственник,140.0,красная книга,,,42.8858,74.817,,...,0,0,0,0,1,0,14000.0,70.0,Кант,False
3,"с. Военно-Антоновка, Октябрьская/Проектируемая",12000,собственник,4.0,"договор купли-продажи, ...",0.0,,42.8582,74.4477,город,...,0,0,0,0,1,0,400.0,30.0,с. Военно-Антоновка,False
4,с. Кош-Коль,65000,собственник,100.0,красная книга,,рассмотрю варианты,42.5419,76.6252,,...,0,0,0,0,0,0,10000.0,6.5,с. Кош-Коль,False
5,"Бишкек, 1-линия -",28000,собственник,6.0,"договор купли-продажи, ...",,,42.827,74.488,город,...,0,0,0,0,1,0,600.0,46.666667,Бишкек,False
6,"с. Туз, ул. А. Дербишева 26",18000,собственник,13.0,,,,42.7898,74.8535,,...,0,0,0,0,0,0,1300.0,13.846154,с. Туз,False
7,Чолпон-Ата,12000,собственник,10.0,зеленая книга,,,42.6459,77.052,,...,0,0,0,0,0,0,1000.0,12.0,Чолпон-Ата,False
8,"Бишкек, Кузнечная крепость, Жибек-Жолу 367",190000,собственник,5.0,"договор купли-продажи, ...",0.0,,42.8855,74.6179,город,...,0,0,0,0,1,0,500.0,380.0,Бишкек,False
9,"Бишкек, Таатан",320000,агент,19.0,,,,42.8803,74.6523,город,...,1,0,0,0,1,0,1900.0,168.421053,Бишкек,False


In [176]:
data.to_csv('sample_data/new_data.csv', index=False)