# 1. Introdução

Ao vender produtos usados online, uma combinação de detalhes minúsculos e diferenciados na descrição de um produto pode fazer uma grande diferença em aumentar os interesses dos clientes. E, mesmo com uma lista otimizada de produtos, a demanda por um produto pode simplesmente não existir. Vendedores que realizam grandes investimentos em anúncios dos seus produtos podem muitas vezes não ter o retorno esperado, fazendo que eles fiquem frustados.

O Aviito , o maior site de anúncios classificados da Rússia, está profundamente familiarizado com este problema. Os vendedores em sua plataforma às vezes se sentem frustrados com as poucas vendas, indicando que o anúncio falta algo para que possa tornar-se um sucesso e com muitas vendas, incidicando que o produto que está sendo vendido está com um preço abaixo do que ele realmente é, fazendo com que o potencial da venda não alcance seu máximo.

Afim de resolver esse problema, foi criado um método para a previsão e análise do anúncio de cada vendedor, para que possa calcular a probabilidade de o item ser vendido ou não, fazendo com que os investimentos em anúncios, por parte dos vendedores, sejam menores, porém de forma eficiente e lucrativa.

# 2. Dados

Para que possamos realizar os cálculos das probabilidades de cada produto, o Avito disponibiliza diversas bases de dados para que possa ser utilizada nessa análise. Dentre elas utilizaremos as bases: *train.csv* e *test.csv*. A primeira base, como o próprio nome diz, será utilizada para o treinamento do modelo desenvolvido, já a segunda será utilizada para a realização dos testes do modelo, ou seja, para sabermos se o modelo se aplica a outros dados ou não. 




Dentro dessas bases, os possuimos os seguintes dados:

* item_id
* user_id
* region
* city
* parent_category_name
* category_name
* param_1
* param_2
* param_3
* title
* description
* price
* item_seq_number
* activation_date
* user_type
* image
* image_top_1
* deal_probability

Para realizar os cáculos somente os dados abaixo serão considerados.

* item_id
* region
* city
* parent_category_name
* category_name
* param_1
* param_2
* param_3
* user_type
* deal_probability

# 3. Pré-Processamento

Os dados disponibilizados possuem um formato aleatório, onde temos letras e números para que possam ser analisados, para realizar a análise temos que normalizar os dados para um único formato. Para normaliza-los, cada classificação que está contida em cada dado, foi gerado um número e associada a ela, como mostra a tabela a seguir.

<table>
    <thead>
        <th style="text-align:center;">id</th>
        <th style="text-align:center;">category_name</th>
        <th style="text-align:center;">parent_category_name</th>
        <th style="text-align:center;">region</th>
        <th style="text-align:center;">user_type</th>
    </thead>
    <tbody>
        <tr>
            <td style="text-align:center">0</td>
            <td style="text-align:center">Товары для детей и игрушки</td>
            <td style="text-align:center">Личные вещи</td>
            <td style="text-align:center">Свердловская область</td>
            <td style="text-align:center">Private</td>
        </tr>
        <tr>
            <td style="text-align:center">1</td>
            <td style="text-align:center">Мебель и интерьер</td>
            <td style="text-align:center">Для дома и дачи</td>
            <td style="text-align:center">Самарская область</td>            
            <td style="text-align:center">Company</td>
        </tr>
        <tr>
            <td style="text-align:center">2</td>
            <td style="text-align:center">Аудио и видео</td>
            <td style="text-align:center">Бытовая электроника</td>
            <td style="text-align:center">Ростовская область</td>
            <td style="text-align:center">Shop</td>
        </tr>
        <tr>
            <td style="text-align:center">3</td>
            <td style="text-align:center">Автомобили</td>
            <td style="text-align:center">Транспорт</td>
            <td style="text-align:center">Татарстан</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">4</td>
            <td style="text-align:center">Ремонт и строительство</td>
            <td style="text-align:center">Недвижимость</td>
            <td style="text-align:center">Волгоградская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">5</td>
            <td style="text-align:center">Одежда, обувь, аксессуары</td>
            <td style="text-align:center">Животные</td>
            <td style="text-align:center">Нижегородская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">6</td>
            <td style="text-align:center">Детская одежда и обувь</td>
            <td style="text-align:center">Хобби и отдых</td>
            <td style="text-align:center">Пермский край</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">7</td>
            <td style="text-align:center">Квартиры</td>
            <td style="text-align:center">Услуги</td>
            <td style="text-align:center">Оренбургская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">8</td>
            <td style="text-align:center">Товары для компьютера</td>
            <td style="text-align:center">Для бизнеса</td>
            <td style="text-align:center">Ханты-Мансийский АО</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">9</td>
            <td style="text-align:center">Собаки</td>
            <td></td>
            <td style="text-align:center">Тюменская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">10</td>
            <td style="text-align:center">Дома, дачи, коттеджи</td>
            <td></td>
            <td style="text-align:center">Башкортостан</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">11</td>
            <td style="text-align:center">Товары для животных</td>
            <td></td>
            <td style="text-align:center">Краснодарский край</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">12</td>
            <td style="text-align:center">Другие животные</td>
            <td></td>
            <td style="text-align:center">Новосибирская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">13</td>
            <td style="text-align:center">Комнаты</td>
            <td></td>
            <td style="text-align:center">Омская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">14</td>
            <td style="text-align:center">Коллекционирование</td>
            <td></td>
            <td style="text-align:center">Белгородская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">15</td>
            <td style="text-align:center">Коммерческая недвижимость</td>
            <td></td>
            <td style="text-align:center">Челябинская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">16</td>
            <td style="text-align:center">Посуда и товары для кухни</td>
            <td></td>
            <td style="text-align:center">Воронежская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">17</td>
            <td style="text-align:center">Красота и здоровье</td>
            <td></td>
            <td style="text-align:center">Кемеровская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">18</td>
            <td style="text-align:center">Аквариум</td>
            <td></td>
            <td style="text-align:center">Саратовская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">19</td>
            <td style="text-align:center">Телефоны</td>
            <td></td>
            <td style="text-align:center">Владимирская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">20</td>
            <td style="text-align:center">Часы и украшения</td>
            <td></td>
            <td style="text-align:center">Калининградская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">21</td>
            <td style="text-align:center">Предложение услуг</td>
            <td></td>
            <td style="text-align:center">Красноярский край</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">22</td>
            <td style="text-align:center">Птицы</td>
            <td></td>
            <td style="text-align:center">Ярославская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">23</td>
            <td style="text-align:center">Спорт и отдых</td>
            <td></td>
            <td style="text-align:center">Удмуртия</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">24</td>
            <td style="text-align:center">Музыкальные инструменты</td>
            <td></td>
            <td style="text-align:center">Алтайский край</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">25</td>
            <td style="text-align:center">Бытовая техника</td>
            <td></td>
            <td style="text-align:center">Иркутская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">26</td>
            <td style="text-align:center">Игры, приставки и программы</td>
            <td></td>
            <td style="text-align:center">Ставропольский край</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">27</td>
            <td style="text-align:center">Земельные участки</td>
            <td></td>
            <td style="text-align:center">Тульская область</td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">28</td>
            <td style="text-align:center">Продукты питания</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">29</td>
            <td style="text-align:center">Кошки</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">30</td>
            <td style="text-align:center">Билеты и путешествия</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">31</td>
            <td style="text-align:center">Книги и журналы</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">32</td>
            <td style="text-align:center">Растения</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">33</td>
            <td style="text-align:center">Гаражи и машиноместа</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">34</td>
            <td style="text-align:center">Мотоциклы и мототехника</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">35</td>
            <td style="text-align:center">Планшеты и электронные книги</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">36</td>
            <td style="text-align:center">Оборудование для бизнеса</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">37</td>
            <td style="text-align:center">Настольные компьютеры</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">38</td>
            <td style="text-align:center">Ноутбуки</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">39</td>
            <td style="text-align:center">Велосипеды</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">40</td>
            <td style="text-align:center">Грузовики и спецтехника</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">41</td>
            <td style="text-align:center">Готовый бизнес</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">42</td>
            <td style="text-align:center">Фототехника</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">43</td>
            <td style="text-align:center">Водный транспорт</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">44</td>
            <td style="text-align:center">Охота и рыбалка</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">45</td>
            <td style="text-align:center">Оргтехника и расходники</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
        <tr>
            <td style="text-align:center">46</td>
            <td style="text-align:center">Недвижимость за рубежом</td>
            <td></td>
            <td></td>
            <td></td>
        </tr>
    </tbody>
</table>

# 4. Modelo

 **Integrante(s)**

>Renan Ferreira de Lima

**Graduação(ões)** 

>Bacharelado em Ciências e Matemáticas da Terra (BCMT)

**DRE(s)**

>116118058

**Prof:** Jonice

*OBS: A(s) graduação(ões) e o(s) DRE(s) está(ão) ordenada(s) de acordo com o(s) integrante(s), ou seja, o primeiro integrante possui a primeira graduação e o primeiro DRE*