# Perfis de aplicativos lucrativos para a App Store e Google Play Markets


Nosso objetivo neste projeto √© encontrar perfis de aplicativos m√≥veis que sejam rent√°veis ‚Äã‚Äãpara os mercados de App Store e Google Play. Estamos trabalhando como analistas de dados para uma empresa que cria aplicativos m√≥veis para Android e iOS, e nosso trabalho √© permitir que nossa equipe de desenvolvedores tome decis√µes baseadas em dados com rela√ß√£o ao tipo de aplicativo que eles criam.

Em nossa empresa, criamos apenas aplicativos gratuitos para download e instala√ß√£o, e nossa principal fonte de receita consiste em an√∫ncios no aplicativo. Isso significa que nossa receita para qualquer aplicativo √© influenciada principalmente pelo n√∫mero de usu√°rios que usam nosso aplicativo. Nosso objetivo para este projeto √© analisar dados para ajudar nossos desenvolvedores a entender quais tipos de aplicativos provavelmente atrair√£o mais usu√°rios.



## Abrindo e explorando os dados


Em setembro de 2018, havia aproximadamente 2 milh√µes de aplicativos iOS dispon√≠veis na App Store e 2,1 milh√µes de aplicativos Android no Google Play.

![img](https://s3.amazonaws.com/dq-content/350/py1m8_statista.png) 

Fonte: [Statista](https://www.statista.com/statistics/276623/number-of-apps-available-in-leading-app-stores)

A coleta de dados de mais de quatro milh√µes de aplicativos requer uma quantidade significativa de tempo e dinheiro, portanto, tentaremos analisar uma amostra de dados. Para evitar gastar recursos com a coleta de novos dados, devemos primeiro tentar ver se podemos encontrar dados existentes relevantes sem nenhum custo. Felizmente, estes s√£o dois conjuntos de dados que parecem adequados para o nosso prop√≥sito:


Um conjunto de dados contendo dados sobre aproximadamente dez mil aplicativos Android do Google Play. Voc√™ pode baixar o conjunto de dados diretamente deste [link](https://dq-content.s3.amazonaws.com/350/googleplaystore.csv).


Um conjunto de dados contendo dados de aproximadamente sete mil aplicativos iOS da App Store. Voc√™ pode baixar o conjunto de dados diretamente deste [link](https://dq-content.s3.amazonaws.com/350/AppleStore.csv).

### Vamos come√ßar abrindo os dois conjuntos de dados e depois continuar explorando os dados.

In [2]:
from csv import reader

### The Google Play data set ###
opened_file = open('googleplaystore.csv')
read_file = reader(opened_file)
android = list(read_file)
android_header = android[0]
android = android[1:]

### The App Store data set ###
opened_file = open('AppleStore.csv')
read_file = reader(opened_file)
ios = list(read_file)
ios_header = ios[0]
ios = ios[1:]

Para facilitar a explora√ß√£o dos dois conjuntos de dados, primeiro escreveremos uma fun√ß√£o chamada `explore_data()` que podemos usar repetidamente para explorar linhas de maneira mais leg√≠vel. Tamb√©m adicionaremos uma op√ß√£o para nossa fun√ß√£o mostrar o n√∫mero de linhas e colunas para qualquer conjunto de dados.

In [3]:
def explore_data(dataset, start, end, rows_and_columns=False):
    dataset_slice = dataset[start:end]    
    for row in dataset_slice:
        print(row)
        print('\n') # adds a new (empty) line between rows
        
    if rows_and_columns:
        print('Number of rows:', len(dataset))
        print('Number of columns:', len(dataset[0]))

print(android_header)
print('\n')
explore_data(android, 0, 3, True)

['App', 'Category', 'Rating', 'Reviews', 'Size', 'Installs', 'Type', 'Price', 'Content Rating', 'Genres', 'Last Updated', 'Current Ver', 'Android Ver']


['Photo Editor & Candy Camera & Grid & ScrapBook', 'ART_AND_DESIGN', '4.1', '159', '19M', '10,000+', 'Free', '0', 'Everyone', 'Art & Design', 'January 7, 2018', '1.0.0', '4.0.3 and up']


['Coloring book moana', 'ART_AND_DESIGN', '3.9', '967', '14M', '500,000+', 'Free', '0', 'Everyone', 'Art & Design;Pretend Play', 'January 15, 2018', '2.0.0', '4.0.3 and up']


['U Launcher Lite ‚Äì FREE Live Cool Themes, Hide Apps', 'ART_AND_DESIGN', '4.7', '87510', '8.7M', '5,000,000+', 'Free', '0', 'Everyone', 'Art & Design', 'August 1, 2018', '1.2.4', '4.0.3 and up']


Number of rows: 10841
Number of columns: 13


In [4]:
print(ios_header)
print('\n')
explore_data(ios, 0, 3, True)

['id', 'track_name', 'size_bytes', 'currency', 'price', 'rating_count_tot', 'rating_count_ver', 'user_rating', 'user_rating_ver', 'ver', 'cont_rating', 'prime_genre', 'sup_devices.num', 'ipadSc_urls.num', 'lang.num', 'vpp_lic']


['284882215', 'Facebook', '389879808', 'USD', '0.0', '2974676', '212', '3.5', '3.5', '95.0', '4+', 'Social Networking', '37', '1', '29', '1']


['389801252', 'Instagram', '113954816', 'USD', '0.0', '2161558', '1289', '4.5', '4.0', '10.23', '12+', 'Photo & Video', '37', '0', '29', '1']


['529479190', 'Clash of Clans', '116476928', 'USD', '0.0', '2130805', '579', '4.5', '4.5', '9.24.12', '9+', 'Games', '38', '5', '18', '1']


Number of rows: 7197
Number of columns: 16


Temos 7.197 aplicativos iOS neste conjunto de dados, e as colunas que parecem interessantes s√£o: `'track_name', 'currency', 'price', 'rating_count_tot', 'rating_count_ver'` e `'prime_genre'`. Nem todos os nomes de coluna s√£o autoexplicativos neste caso, mas os detalhes sobre cada coluna podem ser encontrados na documenta√ß√£o do conjunto de dados.

## Excluindo dados errados

O conjunto de dados do Google Play tem uma se√ß√£o de discuss√£o dedicada, e podemos ver que uma das discuss√µes descreve um erro para a linha 10472. Vamos imprimir esta linha e compar√°-la com o cabe√ßalho e outra linha correta.

In [5]:
print(android[10472])  # incorrect row
print('\n')
print(android_header)  # header
print('\n')
print(android[0])      # correct row

['Life Made WI-Fi Touchscreen Photo Frame', '1.9', '19', '3.0M', '1,000+', 'Free', '0', 'Everyone', '', 'February 11, 2018', '1.0.19', '4.0 and up']


['App', 'Category', 'Rating', 'Reviews', 'Size', 'Installs', 'Type', 'Price', 'Content Rating', 'Genres', 'Last Updated', 'Current Ver', 'Android Ver']


['Photo Editor & Candy Camera & Grid & ScrapBook', 'ART_AND_DESIGN', '4.1', '159', '19M', '10,000+', 'Free', '0', 'Everyone', 'Art & Design', 'January 7, 2018', '1.0.0', '4.0.3 and up']


A linha 10472 corresponde ao aplicativo Life Made WI-Fi Touchscreen Photo Frame, e podemos ver que a classifica√ß√£o √© 19. Isso est√° claramente desativado porque a classifica√ß√£o m√°xima para um aplicativo Google Play √© 5 (como mencionado na se√ß√£o de discuss√µes, este problema √© causado por um valor ausente na coluna 'Categoria'). Como consequ√™ncia, excluiremos esta linha.

In [6]:
print(len(android))
del android[10472]  # don't run this more than once
print(len(android))

10841
10840


## Removendo entradas duplicadas
### Parte 1:
Se explorarmos o conjunto de dados do Google Play por tempo suficiente, descobriremos que alguns aplicativos t√™m mais de uma entrada. Por exemplo, o aplicativo Instagram tem quatro entradas:

In [7]:
for app in android:
    name = app[0]
    if name == 'Instagram':
        print(app)

['Instagram', 'SOCIAL', '4.5', '66577313', 'Varies with device', '1,000,000,000+', 'Free', '0', 'Teen', 'Social', 'July 31, 2018', 'Varies with device', 'Varies with device']
['Instagram', 'SOCIAL', '4.5', '66577446', 'Varies with device', '1,000,000,000+', 'Free', '0', 'Teen', 'Social', 'July 31, 2018', 'Varies with device', 'Varies with device']
['Instagram', 'SOCIAL', '4.5', '66577313', 'Varies with device', '1,000,000,000+', 'Free', '0', 'Teen', 'Social', 'July 31, 2018', 'Varies with device', 'Varies with device']
['Instagram', 'SOCIAL', '4.5', '66509917', 'Varies with device', '1,000,000,000+', 'Free', '0', 'Teen', 'Social', 'July 31, 2018', 'Varies with device', 'Varies with device']


No total, h√° 1.181 casos em que um aplicativo ocorre mais de uma vez:

In [8]:
duplicate_apps = []
unique_apps = []

for app in android:
    name = app[0]
    if name in unique_apps:
        duplicate_apps.append(name)
    else:
        unique_apps.append(name)
    
print('Number of duplicate apps:', len(duplicate_apps))
print('\n')
print('Examples of duplicate apps:', duplicate_apps[:15])

Number of duplicate apps: 1181


Examples of duplicate apps: ['Quick PDF Scanner + OCR FREE', 'Box', 'Google My Business', 'ZOOM Cloud Meetings', 'join.me - Simple Meetings', 'Box', 'Zenefits', 'Google Ads', 'Google My Business', 'Slack', 'FreshBooks Classic', 'Insightly CRM', 'QuickBooks Accounting: Invoicing & Expenses', 'HipChat - Chat Built for Teams', 'Xero Accounting Software']


N√£o queremos contar determinados aplicativos mais de uma vez ao analisar os dados, portanto, precisamos remover as entradas duplicadas e manter apenas uma entrada por aplicativo. Uma coisa que poder√≠amos fazer √© remover as linhas duplicadas aleatoriamente, mas provavelmente poder√≠amos encontrar uma maneira melhor.

Se voc√™ examinar as linhas que imprimimos duas c√©lulas acima para o aplicativo Instagram, a principal diferen√ßa acontece na quarta posi√ß√£o de cada linha, que corresponde ao n√∫mero de avalia√ß√µes. Os diferentes n√∫meros mostram que os dados foram coletados em momentos diferentes. Podemos usar isso para construir um crit√©rio para manter as linhas. N√£o removeremos linhas aleatoriamente, mas manteremos as linhas com o maior n√∫mero de avalia√ß√µes, pois quanto maior o n√∫mero de avalia√ß√µes, mais confi√°veis ‚Äã‚Äãser√£o as classifica√ß√µes.

Para isso, iremos:

Crie um dicion√°rio em que cada chave seja um nome de aplicativo exclusivo e o valor seja o maior n√∫mero de avalia√ß√µes desse aplicativo
Use o dicion√°rio para criar um novo conjunto de dados, que ter√° apenas uma entrada por aplicativo (e selecionamos apenas os aplicativos com maior n√∫mero de avalia√ß√µes)

### Parte dois

Vamos come√ßar construindo o dicion√°rio.

In [9]:
reviews_max = {}

for app in android:
    name = app[0]
    n_reviews = float(app[3])
    
    if name in reviews_max and reviews_max[name] < n_reviews:
        reviews_max[name] = n_reviews
        
    elif name not in reviews_max:
        reviews_max[name] = n_reviews

In [10]:
print('Expected length:', len(android) - 1181)
print('Actual length:', len(reviews_max))

Expected length: 9659
Actual length: 9659


In [11]:
android_clean = []
already_added = []

for app in android:
    name = app[0]
    n_reviews = float(app[3])
    
    if (reviews_max[name] == n_reviews) and (name not in already_added):
        android_clean.append(app)
        already_added.append(name) # make sure this is inside the if block

In [12]:
explore_data(android_clean, 0, 3, True)

['Photo Editor & Candy Camera & Grid & ScrapBook', 'ART_AND_DESIGN', '4.1', '159', '19M', '10,000+', 'Free', '0', 'Everyone', 'Art & Design', 'January 7, 2018', '1.0.0', '4.0.3 and up']


['U Launcher Lite ‚Äì FREE Live Cool Themes, Hide Apps', 'ART_AND_DESIGN', '4.7', '87510', '8.7M', '5,000,000+', 'Free', '0', 'Everyone', 'Art & Design', 'August 1, 2018', '1.2.4', '4.0.3 and up']


['Sketch - Draw & Paint', 'ART_AND_DESIGN', '4.5', '215644', '25M', '50,000,000+', 'Free', '0', 'Teen', 'Art & Design', 'June 8, 2018', 'Varies with device', '4.2 and up']


Number of rows: 9659
Number of columns: 13


## Removendo aplicativos que n√£o est√£o em ingl√™s
### Parte um
Se voc√™ explorar os conjuntos de dados o suficiente, notar√° que os nomes de alguns dos aplicativos sugerem que eles n√£o s√£o direcionados a um p√∫blico que fala ingl√™s. Abaixo, vemos alguns exemplos de ambos os conjuntos de dados:

In [13]:
print(ios[813][1])
print(ios[6731][1])

print(android_clean[4412][0])
print(android_clean[7940][0])

Áà±Â•áËâ∫PPS -„ÄäÊ¨¢‰πêÈ¢Ç2„ÄãÁîµËßÜÂâßÁÉ≠Êí≠
„ÄêËÑ±Âá∫„Ç≤„Éº„É†„ÄëÁµ∂ÂØæ„Å´ÊúÄÂæå„Åæ„Åß„Éó„É¨„Ç§„Åó„Å™„ÅÑ„Åß „ÄúË¨éËß£„ÅçÔºÜ„Éñ„É≠„ÉÉ„ÇØ„Éë„Ç∫„É´„Äú
‰∏≠ÂõΩË™û AQ„É™„Çπ„Éã„É≥„Ç∞
ŸÑÿπÿ®ÿ© ÿ™ŸÇÿØÿ± ÿ™ÿ±ÿ®ÿ≠ DZ


N√£o estamos interessados em manter esse tipo de aplicativo, ent√£o vamos remov√™-los. Uma maneira de fazer isso √© remover cada aplicativo cujo nome cont√©m um s√≠mbolo que n√£o √© comumente usado em texto em ingl√™s ‚Äì o texto em ingl√™s geralmente inclui letras do alfabeto ingl√™s, n√∫meros compostos por d√≠gitos de 0 a 9, sinais de pontua√ß√£o (., ! , ?, ;, etc.) e outros s√≠mbolos (+, *, /, etc.).

Todos esses caracteres espec√≠ficos para textos em ingl√™s s√£o codificados usando o padr√£o ASCII. Cada caractere ASCII tem um n√∫mero correspondente entre 0 e 127 associado a ele, e podemos aproveitar isso para construir uma fun√ß√£o que verifica o nome de um aplicativo e nos informa se ele cont√©m caracteres n√£o ASCII.

Constru√≠mos esta fun√ß√£o abaixo e usamos a fun√ß√£o ord() integrada para descobrir o n√∫mero de codifica√ß√£o correspondente de cada caractere.

In [14]:
def is_english(string):
    
    for character in string:
        if ord(character) > 127:
            return False
    
    return True

print(is_english('Instagram'))
print(is_english('Áà±Â•áËâ∫PPS -„ÄäÊ¨¢‰πêÈ¢Ç2„ÄãÁîµËßÜÂâßÁÉ≠Êí≠'))

True
False


In [15]:
print(is_english('Docs To Go‚Ñ¢ Free Office Suite'))
print(is_english('Instachat üòú'))

print(ord('‚Ñ¢'))
print(ord('üòú'))

False
False
8482
128540


### Parte dois
Para minimizar o impacto da perda de dados, s√≥ removeremos um aplicativo se seu nome tiver mais de tr√™s caracteres n√£o ASCII:

In [16]:
def is_english(string):
    non_ascii = 0
    
    for character in string:
        if ord(character) > 127:
            non_ascii += 1
    
    if non_ascii > 3:
        return False
    else:
        return True

print(is_english('Docs To Go‚Ñ¢ Free Office Suite'))
print(is_english('Instachat üòú'))

True
True


In [17]:
android_english = []
ios_english = []

for app in android_clean:
    name = app[0]
    if is_english(name):
        android_english.append(app)
        
for app in ios:
    name = app[1]
    if is_english(name):
        ios_english.append(app)
        
explore_data(android_english, 0, 3, True)
print('\n')
explore_data(ios_english, 0, 3, True)

['Photo Editor & Candy Camera & Grid & ScrapBook', 'ART_AND_DESIGN', '4.1', '159', '19M', '10,000+', 'Free', '0', 'Everyone', 'Art & Design', 'January 7, 2018', '1.0.0', '4.0.3 and up']


['U Launcher Lite ‚Äì FREE Live Cool Themes, Hide Apps', 'ART_AND_DESIGN', '4.7', '87510', '8.7M', '5,000,000+', 'Free', '0', 'Everyone', 'Art & Design', 'August 1, 2018', '1.2.4', '4.0.3 and up']


['Sketch - Draw & Paint', 'ART_AND_DESIGN', '4.5', '215644', '25M', '50,000,000+', 'Free', '0', 'Teen', 'Art & Design', 'June 8, 2018', 'Varies with device', '4.2 and up']


Number of rows: 9614
Number of columns: 13


['284882215', 'Facebook', '389879808', 'USD', '0.0', '2974676', '212', '3.5', '3.5', '95.0', '4+', 'Social Networking', '37', '1', '29', '1']


['389801252', 'Instagram', '113954816', 'USD', '0.0', '2161558', '1289', '4.5', '4.0', '10.23', '12+', 'Photo & Video', '37', '0', '29', '1']


['529479190', 'Clash of Clans', '116476928', 'USD', '0.0', '2130805', '579', '4.5', '4.5', '9.24.12', '9+'

Podemos ver que ficamos com 9614 aplicativos Android e 6183 aplicativos iOS.

## Isolando os aplicativos gratuitos

Como mencionamos na introdu√ß√£o, criamos apenas aplicativos gratuitos para download e instala√ß√£o, e nossa principal fonte de receita consiste em an√∫ncios no aplicativo. Nossos conjuntos de dados cont√™m aplicativos gratuitos e n√£o gratuitos, e precisaremos isolar apenas os aplicativos gratuitos para nossa an√°lise. Abaixo, isolamos os aplicativos gratuitos para ambos os conjuntos de dados.

In [18]:
android_final = []
ios_final = []

for app in android_english:
    price = app[7]
    if price == '0':
        android_final.append(app)
        
for app in ios_english:
    price = app[4]
    if price == '0.0':
        ios_final.append(app)
        
print(len(android_final))
print(len(ios_final))

8864
3222


Ficamos com 8.864 aplicativos Android e 3.222 aplicativos iOS, o que deve ser suficiente para nossa an√°lise.

## Aplicativos mais comuns por g√™nero
### Parte um
Como mencionamos na introdu√ß√£o, nosso objetivo √© determinar os tipos de aplicativos que provavelmente atrair√£o mais usu√°rios, pois nossa receita √© altamente influenciada pelo n√∫mero de pessoas que usam nossos aplicativos.

Para minimizar riscos e sobrecarga, nossa estrat√©gia de valida√ß√£o para uma ideia de aplicativo √© composta por tr√™s etapas:

1. Crie uma vers√£o m√≠nima do aplicativo para Android e adicione-a ao Google Play.
2. Se o aplicativo tiver uma boa resposta dos usu√°rios, n√≥s o desenvolvemos ainda mais.
3. Se o aplicativo for lucrativo ap√≥s seis meses, tamb√©m criamos uma vers√£o iOS do aplicativo e a adicionamos √† App Store.

Como nosso objetivo final √© adicionar o aplicativo na App Store e no Google Play, precisamos encontrar perfis de aplicativos que sejam bem-sucedidos em ambos os mercados. Por exemplo, um perfil que pode funcionar bem para ambos os mercados pode ser um aplicativo de produtividade que faz uso de gamifica√ß√£o.

Vamos come√ßar a an√°lise entendendo os g√™neros mais comuns para cada mercado. Para isso, criaremos uma tabela de frequ√™ncia para a coluna prime_genre do conjunto de dados da App Store e as colunas G√™neros e Categoria do conjunto de dados do Google Play.

### Parte dois
Construiremos duas fun√ß√µes que podemos usar para analisar as tabelas de frequ√™ncia:

Uma fun√ß√£o para gerar tabelas de frequ√™ncia que mostram porcentagens
Outra fun√ß√£o que podemos usar para exibir as porcentagens em ordem decrescente

In [19]:
def freq_table(dataset, index):
    table = {}
    total = 0
    
    for row in dataset:
        total += 1
        value = row[index]
        if value in table:
            table[value] += 1
        else:
            table[value] = 1
    
    table_percentages = {}
    for key in table:
        percentage = (table[key] / total) * 100
        table_percentages[key] = percentage 
    
    return table_percentages


def display_table(dataset, index):
    table = freq_table(dataset, index)
    table_display = []
    for key in table:
        key_val_as_tuple = (table[key], key)
        table_display.append(key_val_as_tuple)
        
    table_sorted = sorted(table_display, reverse = True)
    for entry in table_sorted:
        print(entry[1], ':', entry[0])

### Parte TR√äS
Come√ßamos examinando a tabela de frequ√™ncia da coluna `prime_genre` do conjunto de dados da App Store.

In [20]:
display_table(ios_final, -5)

Games : 58.16263190564867
Entertainment : 7.883302296710118
Photo & Video : 4.9658597144630665
Education : 3.662321539416512
Social Networking : 3.2898820608317814
Shopping : 2.60707635009311
Utilities : 2.5139664804469275
Sports : 2.1415270018621975
Music : 2.0484171322160147
Health & Fitness : 2.0173805090006205
Productivity : 1.7380509000620732
Lifestyle : 1.5828677839851024
News : 1.3345747982619491
Travel : 1.2414649286157666
Finance : 1.1173184357541899
Weather : 0.8690254500310366
Food & Drink : 0.8069522036002483
Reference : 0.5586592178770949
Business : 0.5276225946617008
Book : 0.4345127250155183
Navigation : 0.186219739292365
Medical : 0.186219739292365
Catalogs : 0.12414649286157665


Podemos ver que entre os aplicativos gratuitos em ingl√™s, mais da metade (58,16%) s√£o jogos. Os aplicativos de entretenimento est√£o perto de 8%, seguidos pelos aplicativos de foto e v√≠deo, que est√£o perto de 5%. Apenas 3,66% dos aplicativos s√£o projetados para educa√ß√£o, seguidos por aplicativos de redes sociais que representam 3,29% dos aplicativos em nosso conjunto de dados.

A impress√£o geral √© que a App Store (pelo menos a parte que cont√©m aplicativos gratuitos em ingl√™s) √© dominada por aplicativos que s√£o projetados para divers√£o (jogos, entretenimento, foto e v√≠deo, redes sociais, esportes, m√∫sica etc.), enquanto aplicativos com prop√≥sitos (educa√ß√£o, compras, servi√ßos p√∫blicos, produtividade, estilo de vida, etc.) s√£o mais raros. No entanto, o fato de os aplicativos divertidos serem os mais numerosos tamb√©m n√£o implica que eles tamb√©m tenham o maior n√∫mero de usu√°rios ‚Äì a demanda pode n√£o ser a mesma da oferta.

Vamos continuar examinando as colunas G√™neros e Categoria do conjunto de dados do Google Play (duas colunas que parecem estar relacionadas).

In [21]:
display_table(android_final, 1) # Category

FAMILY : 18.907942238267147
GAME : 9.724729241877256
TOOLS : 8.461191335740072
BUSINESS : 4.591606498194946
LIFESTYLE : 3.9034296028880866
PRODUCTIVITY : 3.892148014440433
FINANCE : 3.7003610108303246
MEDICAL : 3.531137184115524
SPORTS : 3.395758122743682
PERSONALIZATION : 3.3167870036101084
COMMUNICATION : 3.2378158844765346
HEALTH_AND_FITNESS : 3.0798736462093865
PHOTOGRAPHY : 2.944494584837545
NEWS_AND_MAGAZINES : 2.7978339350180503
SOCIAL : 2.6624548736462095
TRAVEL_AND_LOCAL : 2.33528880866426
SHOPPING : 2.2450361010830324
BOOKS_AND_REFERENCE : 2.1435018050541514
DATING : 1.861462093862816
VIDEO_PLAYERS : 1.7937725631768955
MAPS_AND_NAVIGATION : 1.3989169675090252
FOOD_AND_DRINK : 1.2409747292418771
EDUCATION : 1.1620036101083033
ENTERTAINMENT : 0.9589350180505415
LIBRARIES_AND_DEMO : 0.9363718411552346
AUTO_AND_VEHICLES : 0.9250902527075812
HOUSE_AND_HOME : 0.8235559566787004
WEATHER : 0.8009927797833934
EVENTS : 0.7107400722021661
PARENTING : 0.6543321299638989
ART_AND_DESIGN : 

In [22]:
display_table(android_final, -4)

Tools : 8.449909747292418
Entertainment : 6.069494584837545
Education : 5.347472924187725
Business : 4.591606498194946
Productivity : 3.892148014440433
Lifestyle : 3.892148014440433
Finance : 3.7003610108303246
Medical : 3.531137184115524
Sports : 3.463447653429603
Personalization : 3.3167870036101084
Communication : 3.2378158844765346
Action : 3.1024368231046933
Health & Fitness : 3.0798736462093865
Photography : 2.944494584837545
News & Magazines : 2.7978339350180503
Social : 2.6624548736462095
Travel & Local : 2.3240072202166067
Shopping : 2.2450361010830324
Books & Reference : 2.1435018050541514
Simulation : 2.0419675090252705
Dating : 1.861462093862816
Arcade : 1.8501805054151623
Video Players & Editors : 1.7712093862815883
Casual : 1.7599277978339352
Maps & Navigation : 1.3989169675090252
Food & Drink : 1.2409747292418771
Puzzle : 1.128158844765343
Racing : 0.9927797833935018
Role Playing : 0.9363718411552346
Libraries & Demo : 0.9363718411552346
Auto & Vehicles : 0.9250902527075