**Kickstarter**

En la actualidad, las pequeñas empresas o los emprendimientos individuales tienen cada vez más formas de financiamiento. A los tradicionales créditos bancarios, las subvenciones, la ayuda de familiares o amigos cercanos y el ahorro, se le suman las nuevas tendencias de financiamiento que trae la era tecnológica.

El crowdfunding es una de esas formas de financiación actual que tiene cada vez más fuerza en el mundo. La palabra “crowdfunding” traduce al español “cooperación colectiva” y hace referencia a crear una red de inversionistas que permita conseguir recursos o dinero para financiar iniciativas de otras organizaciones o personas.

Kickstarter busca una gran cantidad de cooperaciones para proyectos innovadores y ambiciosos, de cualquier tipo. El proceso consiste en que los creadores de cada proyecto deben fijar una meta de dinero a alcanzar y un tiempo en el que lo quieren recaudar. Luego, las personas que tienen acceso a la información de la propuesta creativa deciden si les gusta, si desean contribuir y en cuánto hacerlo.

El financiamiento en Kickstarter está definido por sus fundadores como un “todo o nada”, lo que quiere decir que sólo si el proyecto logra recaudar el monto meta en el plazo estipulado, se le darán los fondos a los creativos para que logren hacer realidad su programa y este será clasificado como “éxito”, de lo contrario, no obtendrán nada de dinero y el proyecto será “fracaso”.

Por lo anterior vale la pena preguntarse, qué varaibles hacen que un proyecto sea más atractivo para los inversionistas.


In [None]:
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.tools as tls
import plotly.offline as py
from plotly.offline import init_notebook_mode, iplot, plot
import plotly.graph_objs as go
init_notebook_mode(connected=True)
import warnings
from collections import Counter
kickstarter_filepath = "../input/18k_Projects.csv"
kickstarter=pd.read_csv(kickstarter_filepath)
kickstarter.head()

La base de datos muestra las principales características de los proyectos que ya cumplieron su tiempo límite de recaudo y fueron clasificados dentro de la categoría de éxito o fracaso, dentro de esta se encuntran variables como la categoria, el monto recaudado, el número de inversionistas, la duración del proyecto y otra serie se variables que se recolectaron de la plataforma kickstarter.

In [None]:
kickstarter.drop(['Id','Name','Url','Creator','Start','End','Latitude','Longitude','Start Timestamp (UTC)','End Timestamp (UTC)','Creator Bio','Creator Website'],axis=1)
print(kickstarter.info())
kickstarter.iloc[:,~kickstarter.columns.isin(['name','mfr','type','rating'])].describe()

De la base anterior se extrajeron las variables como las de idenficiación del proyecto y del creador, estas no generan información relevante.

Para las variables restantes se puede realizar una estadistica descriptiva.

Lo primero que se debe saber acerca de estos datos es el porcentaje de los datos que son casos exitosos y casos de fracaso.

In [None]:
percentual_sucess = round(kickstarter["State"].value_counts() / len(kickstarter["State"]) * 100,2)

print("State Percentual in %: ")
print(percentual_sucess)

state = round(kickstarter["State"].value_counts() / len(kickstarter["State"]) * 100,2)

labels = 'successful', 'failed'
values = list(state.values)

trace1 = go.Pie(labels=labels, values=values, marker=dict(colors=['red']))

layout = go.Layout(title='Distribuition of States', legend=dict(orientation="h"));

fig = go.Figure(data=[trace1], layout=layout)
iplot(fig)


En esta gráfica se puede observar que los datos estan distribuidos aproximadamente en igual proporción.

Category presenta la categoría a la que pertenecen los proyectos. Kickstarter permite a sus usuarios lanzar proyectos en una gran variedad de categorías.

A continuación se presentan tres graficas: 

1. Top 15 Failed: Contiene las 15 categorias con más fracasos, podemos observar que product design, fashion y food son las categorias con más fracasos
2. Top 15 successful: Contiene las 15 categorias con más exitos, podemos observar que music, tabletop games y product design son las categorias con más exitos
3. Top 25 all category´s: presenta las 25 categorias con más proyectos, podemos observar que product design, food y music, son las que más proyectos tienen.

De acá podemos observar que la categoria no necesariamente garantiza el exitoso, esto porque aunque una categoria se encuentre dentro de las categorias con mas exitos también se puede encontrar dentro de las que tiene más fracasos.


In [None]:
categorys_failed = kickstarter[kickstarter["State"] == "failed"]["Category"].value_counts()[:25]
categorys_sucessful = kickstarter[kickstarter["State"]  == "successful"]["Category"].value_counts()[:25]
categorys_general = kickstarter["Category"].value_counts()[:25]

#First plot
trace0 = go.Histogram(
    x=kickstarter[(kickstarter.Category.isin(categorys_failed.index.values)) & 
              (kickstarter["State"] == "failed")]['Category'].head(100000),
    histnorm='percent', name="Top 15 Failed", showlegend=False
)
#Second plot
trace1 = go.Histogram(
    x=kickstarter[(kickstarter.Category.isin(categorys_sucessful.index.values)) & 
              (kickstarter["State"] == "successful")]['Category'].head(100000),
    histnorm='percent', name="Top 15 Sucessful", showlegend=False
)

#Third plot
trace2 = go.Histogram(
    x=kickstarter[(kickstarter.Category.isin(categorys_general.index.values))]['Category'].head(100000),
    histnorm='percent', name="Top 25 All Category's", showlegend=False
)

#Creating the grid
fig = tls.make_subplots(rows=2, cols=2, specs=[[{}, {}], [{'colspan': 2}, None]],
                          subplot_titles=('Top 15 Failed','Top 15 Sucessful', "Top 25 All Category's"))

#setting the figs
fig.append_trace(trace0, 1, 1)
fig.append_trace(trace1, 1, 2)
fig.append_trace(trace2, 2, 1)

fig['layout'].update(showlegend=True, title="Top Frequency Category's")
iplot(fig)

In [None]:

# Display the histogram to undestand the data
f, axes = plt.subplots(2,3, figsize=(20, 12))
sns.distplot( kickstarter["Updates"], ax=axes[0,0])
sns.distplot( kickstarter["Comments"], ax=axes[0,1])
sns.distplot( kickstarter["Rewards"], ax=axes[0,2])
sns.distplot( kickstarter["Backers"], ax=axes[1,0])
sns.distplot( kickstarter["Duration in Days"], ax=axes[1,1])
sns.distplot( kickstarter["Facebook Shares"], ax=axes[1,2])


Los premios que se le dan a los inversionistas son una forma de atraerlos, se puede observar que la cantidad de niveles para premios en los proyectos es muy variable.

Adicionalmente, algo fundamental del crowdfunding es la cantidad de personas que invierten en los proyectos, para los creadores de campañas es muy importante hacer que sus proyectos los vean la mayor cantidad de personas, un medio para lograr esto es promocionar sus campañas a través de facebook.
La  variable duración de la campaña de los proyectos.Se encuentra en un rango entre 1 y 60 días, es decir que los creadores deben conseguir sus recursos en un tiempo muy corto, aunque según lo muestra el siguiente histograma,  la mayoría de los creadores decidió dejar su campaña con una duración de 30 días.

Muchas variables influyen en el comportamiento de los inversionistas, algunas de las que se puede evidenciar son la categoria, premios, el alcance de la campaña (Facebook Shares), etc. para una mayor aproximación a los datos valdría la pena hacer modelos predictivos como arboles de decisión para observar la importancia de las variables a la hora de que un proyecto sea más atractivo y sea exitoso.
