# Tìm thể loại ứng dụng có khả năng sinh lời trên Google Play và App Store

Giả định rằng tôi đang làm việc cho một công ty thiết kế ứng dụng di động. Doanh thu của công ty đến từ quảng cáo bên trong ứng dụng miễn phí. Mục tiêu của chúng ta là phân tích và giúp các nhà phát triển tìm ra các thể loại ứng dụng thu hút nhiều người dùng.

Tôi đã sử dụng 2 tệp dữ liệu về ứng dụng trên Google Play và App Store được chia sẻ trên Kaggle để phân tích. Tôi sẽ làm sạch dữ liệu, phân tích xem thể loại ứng dụng nào chiếm tỷ lệ nhiều nhất, có nhiều lượt cài đặt và đánh giá nhất để đưa ra các đề xuất.

**Tóm tắt kết quả**

Kết quả là tôi đã tìm được 6 thể loại ứng dụng thu hút người dùng nhất (Video or Music, Photography, Book, Productivity, Game, Tools) và gợi ý cụ thể một vài ứng dụng cho các thể loại này.

## Khám phá các tệp dữ liệu

- **Dữ liệu ứng dụng trên Google Play:** [Xem trên Kaggle](https://www.kaggle.com/lava18/google-play-store-apps), bạn có thể lại nó [tại đây](https://dq-content.s3.amazonaws.com/350/googleplaystore.csv).
- **Dữ liệu ứng dụng trên App Store:** [Xem trên Kaggle](https://www.kaggle.com/ramamet4/app-store-apple-data-set-10k-apps), bạn có thể tải nó [tại đây](https://dq-content.s3.amazonaws.com/350/AppleStore.csv).

Khi đọc bình luận trên 2 tệp dữ liệu này, chúng ta thấy rằng trong tệp dữ liệu Google Play có [lỗi sai thông tin dữ liệu ở dòng 10472](https://www.kaggle.com/lava18/google-play-store-apps/discussion/66015) và [lỗi trùng lặp dữ liệu](https://www.kaggle.com/lava18/google-play-store-apps/discussion/67894).

Như vậy công việc làm sạch dữ liệu của chúng ta sẽ có thêm việc xử lý 2 lỗi này. Bây giờ hãy cùng tôi khám phá 2 tệp dữ liệu này nhé.

In [1]:
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd

In [2]:
# Explore Android dataset
df_android = pd.read_csv('googleplaystore.csv')
print(df_android.shape)
df_android.head(2)

(10841, 13)


Unnamed: 0,App,Category,Rating,Reviews,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
0,Photo Editor & Candy Camera & Grid & ScrapBook,ART_AND_DESIGN,4.1,159,19M,"10,000+",Free,0,Everyone,Art & Design,"January 7, 2018",1.0.0,4.0.3 and up
1,Coloring book moana,ART_AND_DESIGN,3.9,967,14M,"500,000+",Free,0,Everyone,Art & Design;Pretend Play,"January 15, 2018",2.0.0,4.0.3 and up


Dữ liệu từ Google Play (Android) có 10841 dòng và 13 cột. Tên của các cột này khá rõ ràng để giúp chúng ta hiểu được dữ liệu của chúng (App, Category, Rating, Reviews, Size, Installs, Type, Price,...).

In [3]:
# Explore IOS dataset
df_ios = pd.read_csv('AppleStore.csv')
print(df_ios.shape)
df_ios.head(2)

(7197, 16)


Unnamed: 0,id,track_name,size_bytes,currency,price,rating_count_tot,rating_count_ver,user_rating,user_rating_ver,ver,cont_rating,prime_genre,sup_devices.num,ipadSc_urls.num,lang.num,vpp_lic
0,284882215,Facebook,389879808,USD,0.0,2974676,212,3.5,3.5,95.0,4+,Social Networking,37,1,29,1
1,389801252,Instagram,113954816,USD,0.0,2161558,1289,4.5,4.0,10.23,12+,Photo & Video,37,0,29,1


Dữ liệu từ App Store (IOS) có 7197 dòng và 16 cột. Một số cột có tên dễ hiểu để sử dụng (track_name, size_bytes, currency, price, rating_count_tot, prime_genre) và một số cột khác có tên chưa rõ ràng nhưng chúng ta có thể [tìm hiểu chúng](https://www.kaggle.com/ramamet4/app-store-apple-data-set-10k-apps/home) khi cần thiết.

## Xóa dữ liệu bị sai

Theo [bình luận trên Kaggle](https://www.kaggle.com/lava18/google-play-store-apps/discussion/66015) thì dữ liệu ứng dụng Google Play có 1 dòng bị sai thông tin (10472). Nhưng để biết chính xác dòng 10472 là ở dataset có tính header hay không thì chúng ta phải tự kiểm tra.

In [4]:
# Check wrong data 10472
df_android[10472:10473]

Unnamed: 0,App,Category,Rating,Reviews,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
10472,Life Made WI-Fi Touchscreen Photo Frame,1.9,19.0,3.0M,"1,000+",Free,0,Everyone,,"February 11, 2018",1.0.19,4.0 and up,


Như vậy dữ liệu Google Play bị sai ở dòng 10472 do thiếu Category. Bây giờ chúng ta sẽ xóa dòng này.

In [5]:
# Delete wrong data 10472
df_android.drop(index=10472, inplace=True)

In [6]:
df_android.shape

(10840, 13)

## Xóa dữ liệu bị trùng lặp
Trước khi xóa dữ liệu trùng lặp, chúng ta nên kiểm tra xem chúng trùng lặp như thế thế nào.

In [7]:
# Check duplicated Android
df_android_dup = df_android[df_android.App.duplicated(keep=False) == True].sort_values(by='App')
print(df_android_dup.shape)
df_android_dup.head()

(1979, 13)


Unnamed: 0,App,Category,Rating,Reviews,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
1393,10 Best Foods for You,HEALTH_AND_FITNESS,4.0,2490,3.8M,"500,000+",Free,0,Everyone 10+,Health & Fitness,"February 17, 2017",1.9,2.3.3 and up
1407,10 Best Foods for You,HEALTH_AND_FITNESS,4.0,2490,3.8M,"500,000+",Free,0,Everyone 10+,Health & Fitness,"February 17, 2017",1.9,2.3.3 and up
2543,1800 Contacts - Lens Store,MEDICAL,4.7,23160,26M,"1,000,000+",Free,0,Everyone,Medical,"July 27, 2018",7.4.1,5.0 and up
2322,1800 Contacts - Lens Store,MEDICAL,4.7,23160,26M,"1,000,000+",Free,0,Everyone,Medical,"July 27, 2018",7.4.1,5.0 and up
2385,2017 EMRA Antibiotic Guide,MEDICAL,4.4,12,3.8M,"1,000+",Paid,$16.99,Everyone,Medical,"January 27, 2017",1.0.5,4.0.3 and up


In [8]:
# Check duplicated IOS
df_ios_dup = df_ios[df_ios.track_name.duplicated(keep=False) == True].sort_values(by='track_name')
print(df_ios_dup.shape)
df_ios_dup.head()

(4, 16)


Unnamed: 0,id,track_name,size_bytes,currency,price,rating_count_tot,rating_count_ver,user_rating,user_rating_ver,ver,cont_rating,prime_genre,sup_devices.num,ipadSc_urls.num,lang.num,vpp_lic
2948,1173990889,Mannequin Challenge,109705216,USD,0.0,668,87,3.0,3.0,1.4,9+,Games,37,4,1,1
4463,1178454060,Mannequin Challenge,59572224,USD,0.0,105,58,4.0,4.5,1.0.1,4+,Games,38,5,1,1
4442,952877179,VR Roller Coaster,169523200,USD,0.0,107,102,3.5,3.5,2.0.0,4+,Games,37,5,1,1
4831,1089824278,VR Roller Coaster,240964608,USD,0.0,67,44,3.5,4.0,0.81,4+,Games,38,0,1,1


Như vậy chỉ có Google Play bị trùng lặp 1979 dòng và IOS bị trùng lặp 4 dòng. Bây giờ chúng ta kiểm tra chi tiết hơn với một ứng dụng bất kỳ như `8 Ball Pool` bên Android để xem chúng có hoàn toàn giống nhau 100% hay không.

In [9]:
# View duplicate 8 Ball Pool Android
df_android_dup[df_android_dup.App == '8 Ball Pool']

Unnamed: 0,App,Category,Rating,Reviews,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
3953,8 Ball Pool,SPORTS,4.5,14184910,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1970,8 Ball Pool,GAME,4.5,14201604,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1844,8 Ball Pool,GAME,4.5,14200550,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1755,8 Ball Pool,GAME,4.5,14200344,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1703,8 Ball Pool,GAME,4.5,14198602,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1675,8 Ball Pool,GAME,4.5,14198297,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up
1871,8 Ball Pool,GAME,4.5,14201891,52M,"100,000,000+",Free,0,Everyone,Sports,"July 31, 2018",4.0.0,4.0.3 and up


Chúng ta thấy rằng các dòng này có sự khác nhau ở cột `Reviews`. Theo logic thì các giá trị cao nhất có thể là dữ mới nhất được cập nhật, tương tự nhìn lại bên IOS là cột `rating_count_tot`. Vì vậy chúng ta nên giữ lại dòng có reviews cao nhất và xóa các dòng bị trùng lặp còn lại.

### Xóa dữ liệu trùng lặp Android

In [10]:
# Change type Reviews column
df_android_dup.Reviews = df_android_dup.Reviews.astype(int)
df_android.Reviews = df_android.Reviews.astype(int)

In [11]:
# Find the maximum reivews of each app
df_android_reviews_max = df_android.groupby('App')['Reviews'].max().reset_index()
df_android_reviews_max

Unnamed: 0,App,Reviews
0,"""i DT"" Fútbol. Todos Somos Técnicos.",27
1,+Download 4 Instagram Twitter,40467
2,- Free Comics - Comic Apps,115
3,.R,259
4,/u/app,573
...,...,...
9654,"뽕티비 - 개인방송, 인터넷방송, BJ방송",414
9655,💎 I'm rich,718
9656,"💘 WhatsLov: Smileys of love, stickers and GIF",22098
9657,📏 Smart Ruler ↔️ cm/inch measuring for homework!,19


In [12]:
# Remove duplicated apps for android
df_android_reviews_merge = pd.merge(df_android_reviews_max, df_android, on=['App','Reviews'], how='left').drop_duplicates().reset_index(drop=True)
print(df_android_reviews_merge.shape)
df_android_reviews_merge.head()

(9665, 13)


Unnamed: 0,App,Reviews,Category,Rating,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
0,"""i DT"" Fútbol. Todos Somos Técnicos.",27,SPORTS,,3.6M,500+,Free,0,Everyone,Sports,"October 7, 2017",0.22,4.1 and up
1,+Download 4 Instagram Twitter,40467,SOCIAL,4.5,22M,"1,000,000+",Free,0,Everyone,Social,"August 2, 2018",5.03,4.1 and up
2,- Free Comics - Comic Apps,115,COMICS,3.5,9.1M,"10,000+",Free,0,Mature 17+,Comics,"July 13, 2018",5.0.12,5.0 and up
3,.R,259,TOOLS,4.5,203k,"10,000+",Free,0,Everyone,Tools,"September 16, 2014",1.1.06,1.5 and up
4,/u/app,573,COMMUNICATION,4.7,53M,"10,000+",Free,0,Mature 17+,Communication,"July 3, 2018",4.2.4,4.1 and up


So sánh số dòng của `df_android_reviews_merge` và `df_android_reviews_max` ta thấy có sự khác nhau (9665 và 9659). Như vậy vẫn còn vài ứng dụng trùng lặp, chúng ta sẽ kiểm tra thế nào.

In [13]:
df_android_dup_2 = df_android_reviews_merge[df_android_reviews_merge.App.duplicated(keep=False) == True].sort_values(by='App').reset_index(drop=True)
df_android_dup_2

Unnamed: 0,App,Reviews,Category,Rating,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
0,Candy Bomb,42145,GAME,4.4,20M,"10,000,000+",Free,0,Everyone,Casual;Brain Games,"July 4, 2018",2.9.3181,4.0.3 and up
1,Candy Bomb,42145,FAMILY,4.4,20M,"10,000,000+",Free,0,Everyone,Casual;Brain Games,"July 4, 2018",2.9.3181,4.0.3 and up
2,Fuzzy Numbers: Pre-K Number Foundation,21,EDUCATION,4.7,44M,"1,000+",Paid,$5.99,Everyone,Education;Education,"July 21, 2017",1.3,4.1 and up
3,Fuzzy Numbers: Pre-K Number Foundation,21,FAMILY,4.7,44M,"1,000+",Paid,$5.99,Everyone,Education;Education,"July 21, 2017",1.3,4.1 and up
4,Learn C++,73404,EDUCATION,4.6,5.3M,"1,000,000+",Free,0,Everyone,Education,"December 25, 2017",4.5.2,4.0 and up
5,Learn C++,73404,FAMILY,4.6,5.3M,"1,000,000+",Free,0,Everyone,Education,"December 25, 2017",4.5.2,4.0 and up
6,Target - now with Cartwheel,68406,SHOPPING,4.1,24M,"10,000,000+",Free,0,Everyone,Shopping,"July 25, 2018",6.25.0+1906001476,5.0 and up
7,Target - now with Cartwheel,68406,SHOPPING,4.1,24M,"10,000,000+",Free,0,Everyone,Shopping,"August 6, 2018",6.25.0+1906001476,5.0 and up
8,YouTube Gaming,130549,ENTERTAINMENT,4.2,Varies with device,"5,000,000+",Free,0,Teen,Entertainment,"June 27, 2018",2.08.78.2,4.1 and up
9,YouTube Gaming,130549,FAMILY,4.2,Varies with device,"5,000,000+",Free,0,Teen,Entertainment,"June 27, 2018",2.08.78.2,4.1 and up


Mặc dù `Reviews` đúng số lớn nhất nhưng các dòng trùng lặp có sự khác nhau ở `Category` và `Last Updated`. Cách xử lý như sau:
- Giữ lại `Last Updated` mới nhất.
- Giữ lại `Category` có trong `Genres`.

In [14]:
# Change type of Last Updated to datetime
df_android_dup_2['Last Updated'] = pd.to_datetime(df_android_dup_2['Last Updated'])
df_android_reviews_merge['Last Updated'] = pd.to_datetime(df_android_reviews_merge['Last Updated'])

In [15]:
# Find the last updated
df_android_updated_max = df_android_dup_2.groupby('App')['Last Updated'].max().reset_index()
df_android_updated_max

Unnamed: 0,App,Last Updated
0,Candy Bomb,2018-07-04
1,Fuzzy Numbers: Pre-K Number Foundation,2017-07-21
2,Learn C++,2017-12-25
3,Target - now with Cartwheel,2018-08-06
4,YouTube Gaming,2018-06-27
5,osmino Wi-Fi: free WiFi,2018-08-07


In [16]:
# Remove duplicated apps
df_android_dup_2_removed = pd.merge(df_android_updated_max, df_android_dup_2, on=['App','Last Updated'], how='left')
df_android_dup_2_removed.Genres = df_android_dup_2_removed.Genres.str.upper()
df_android_dup_2_removed = df_android_dup_2_removed[df_android_dup_2_removed.apply(lambda x : x['Category'] in x['Genres'], axis=1)]
df_android_dup_2_removed

Unnamed: 0,App,Last Updated,Reviews,Category,Rating,Size,Installs,Type,Price,Content Rating,Genres,Current Ver,Android Ver
0,Candy Bomb,2018-07-04,42145,GAME,4.4,20M,"10,000,000+",Free,0,Everyone,CASUAL;BRAIN GAMES,2.9.3181,4.0.3 and up
2,Fuzzy Numbers: Pre-K Number Foundation,2017-07-21,21,EDUCATION,4.7,44M,"1,000+",Paid,$5.99,Everyone,EDUCATION;EDUCATION,1.3,4.1 and up
4,Learn C++,2017-12-25,73404,EDUCATION,4.6,5.3M,"1,000,000+",Free,0,Everyone,EDUCATION,4.5.2,4.0 and up
6,Target - now with Cartwheel,2018-08-06,68406,SHOPPING,4.1,24M,"10,000,000+",Free,0,Everyone,SHOPPING,6.25.0+1906001476,5.0 and up
7,YouTube Gaming,2018-06-27,130549,ENTERTAINMENT,4.2,Varies with device,"5,000,000+",Free,0,Teen,ENTERTAINMENT,2.08.78.2,4.1 and up
9,osmino Wi-Fi: free WiFi,2018-08-07,134203,TOOLS,4.2,4.1M,"10,000,000+",Free,0,Everyone,TOOLS,6.06.14,4.4 and up


In [17]:
# Create removed duplicated apps name list
df_android_dup_2_name = df_android_dup_2_removed.App.values.tolist()

In [18]:
# Filter and combine to get the Android unique apps
df_android_unique = pd.concat([df_android_reviews_merge.query('App not in @df_android_dup_2_name'), df_android_dup_2_removed])
print(df_android_unique.shape)
df_android_unique.head(2)

(9659, 13)


Unnamed: 0,App,Reviews,Category,Rating,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
0,"""i DT"" Fútbol. Todos Somos Técnicos.",27,SPORTS,,3.6M,500+,Free,0,Everyone,Sports,2017-10-07,0.22,4.1 and up
1,+Download 4 Instagram Twitter,40467,SOCIAL,4.5,22M,"1,000,000+",Free,0,Everyone,Social,2018-08-02,5.03,4.1 and up


### Xóa dữ liệu trùng lặp IOS

Với IOS thì chỉ có 2 ứng dụng bị trùng lặp, ta sẽ xóa những dòng có số lượng rating thấp hơn theo index của chúng.

In [19]:
df_ios_unique = df_ios.drop(index=[4463,4831])
df_ios_unique.shape

(7195, 16)

## Lọc ra các ứng dụng ngôn ngữ tiếng Anh
Công ty của tôi chỉ nhắm đến người dùng sử dụng ngôn ngữ tiếng Anh mà thôi. Vì vậy chúng ta phải loại bỏ các ứng dụng có tên không phải là tiếng Anh.

Theo [ASCII - Wikipedia](https://en.wikipedia.org/wiki/ASCII) (American Standard Code for Information Interchange) thì có 127 ký tự trong tiếng Anh, chúng bao gồm các chữ cái (a,A,b,B,c,C,...) và các ký tự thông dụng trên bàn phím (+,-,@,!,~,...). Chúng ta sẽ dùng hàm `ord('string')` trong Python để xử lý vấn đề này.

In [20]:
# Check English name
def is_english(app_name):
    for i in app_name:
        if ord(i) > 127:
            return False
    return True

print(is_english('Instachat 😜'))
print(is_english('Facebook'))
print(is_english('Official QR Code® Reader "Q"'))
print(is_english('RPG ブレイジング ソウルズ アクセレイト'))

False
True
False
False


Funtion này đã giúp chúng ta xác định được tên của ứng dụng có phải tiếng Anh hay không. Tuy nhiên, có một số ứng dụng chỉ chứa 1-2 ký tự nằm ngoài ASCII (Ví dụ: Instachat 😜), nếu chúng ta loại bỏ chúng thì sẽ mất một lượng dữ liệu hưu ích. Vì vậy, chúng ta sẽ chấp nhận các ứng có không quá 3 ký tự nàm ngoài ASCII trong tên của chúng.

In [21]:
# Check English name - allow 3 characters outside of ASCII
def is_english(app_name):
    non_ascii = 0
    for i in app_name:
        if ord(i) > 127:
            non_ascii += 1
    if non_ascii > 3:
        return False
    else:
        return True

print(is_english('Instachat 😜'))
print(is_english('Facebook'))
print(is_english('Official QR Code® Reader "Q"'))
print(is_english('RPG ブレイジング ソウルズ アクセレイト'))

True
True
True
False


Function này đã tốt hơn. Bây giờ chúng ta sẽ tạo 2 danh sách ứng dụng mới chỉ có tên tiếng Anh cho Android và IOS.

In [22]:
# Create 2 english apps dataframes for Android and IOS
df_android_english = df_android_unique[df_android_unique.apply(lambda x : is_english(x.App), axis=1)]
df_ios_english = df_ios_unique[df_ios_unique.apply(lambda x : is_english(x.track_name), axis=1)]

## Lọc ra các ứng dụng ngôn ngữ tiếng Anh "miễn phí"

Doanh thu của công ty đến từ quảng cáo bên trong các ứng dụng miễn phí. Vì vậy chúng ta cần lọc ra các ứng dụng miễn để phân tích.

In [23]:
# Create Androis english free (final)
df_android_english_free = df_android_english[df_android_english.Price == '0']
print(df_android_english_free.shape)
df_android_english_free.head(2)

(8864, 13)


Unnamed: 0,App,Reviews,Category,Rating,Size,Installs,Type,Price,Content Rating,Genres,Last Updated,Current Ver,Android Ver
0,"""i DT"" Fútbol. Todos Somos Técnicos.",27,SPORTS,,3.6M,500+,Free,0,Everyone,Sports,2017-10-07,0.22,4.1 and up
1,+Download 4 Instagram Twitter,40467,SOCIAL,4.5,22M,"1,000,000+",Free,0,Everyone,Social,2018-08-02,5.03,4.1 and up


In [24]:
# Create IOS english free (final)
df_ios_english_free = df_ios_english[df_ios_english.price == 0]
print(df_ios_english_free.shape)
df_ios_english_free.head(2)

(3220, 16)


Unnamed: 0,id,track_name,size_bytes,currency,price,rating_count_tot,rating_count_ver,user_rating,user_rating_ver,ver,cont_rating,prime_genre,sup_devices.num,ipadSc_urls.num,lang.num,vpp_lic
0,284882215,Facebook,389879808,USD,0.0,2974676,212,3.5,3.5,95.0,4+,Social Networking,37,1,29,1
1,389801252,Instagram,113954816,USD,0.0,2161558,1289,4.5,4.0,10.23,12+,Photo & Video,37,0,29,1


Công việc làm sạch dữ liệu đã hoàn tất. Bây giờ chúng ta sẽ tiến hành phân tích.

## Phân tích các thể loại ứng dụng phổ biến

Chúng ta sẽ phân tích tỷ lệ các thể loại ứng dụng để xem mức độ cạnh tranh như thế nào. Cả 2 tệp dữ liệu đều có các cột giúp chúng ta làm được việc này.

- **Google Play:** Category, Genres
- **App Store:** prime_genre

### Android
Cột Category thể hiện chính xác hơn tỷ lệ cho từng thể loại, còn cột Genres đang gộp nhiều thể loại với nhau (Ví dụ: Educational;Brain Games và Entertainment;Brain Games). Vì vậy chúng ta sẽ chỉ dùng cột Category để phân tích về sau.

In [25]:
# Calculate Android categories proportion
pd.DataFrame(round((df_android_english_free.Category.value_counts()/df_android_english_free.shape[0])*100,2)).set_axis(['Proportion'],axis=1)

Unnamed: 0,Proportion
FAMILY,18.91
GAME,9.72
TOOLS,8.46
BUSINESS,4.59
LIFESTYLE,3.9
PRODUCTIVITY,3.89
FINANCE,3.7
MEDICAL,3.53
SPORTS,3.4
PERSONALIZATION,3.32


- Thể loại ứng dụng chiếm tỷ lệ lớn nhất là FAMILY (18.91%), kế đến là GAME (9.72%), TOOLS (8.46%), BUSINESS (4.59%) VÀ LIFESTYLE (3.90%).
- Khi [kiểm tra trên website Google Play](https://play.google.com/store/apps/category/FAMILY) thì chúng ta thấy rằng thể loại FAMILY thực chất là những trò chơi dành cho trẻ em.

![FAMILY](attachment:Screen%20Shot%202021-11-10%20at%2020.54.32.png)

### IOS

In [26]:
# Calculate IOS genres proportion
pd.DataFrame(round((df_ios_english_free.prime_genre.value_counts()/df_ios_english_free.shape[0])*100,2)).set_axis(['Proportion'],axis=1)

Unnamed: 0,Proportion
Games,58.14
Entertainment,7.89
Photo & Video,4.97
Education,3.66
Social Networking,3.29
Shopping,2.61
Utilities,2.52
Sports,2.14
Music,2.05
Health & Fitness,2.02


- Thể loại chiếm tỷ lệ lớn nhất là Games (58.14%), kế đến là Entertaiment (7.89%), Photo & Video (4.97%), Education (3.66%) và Social Networking (3.29%).
- Nhìn chung ứng dụng miễn phí trên App Store mang tính giải trí nhiều hơn, riêng thể loại Games đã chiếm hơn 50%.

### Kết luận

Qua việc phân tích tỷ lệ các thể loại ứng dụng trên Google Play và App Store, chúng ta kết luận rằng phần lớn ứng dụng trên Google Play và App Store là ứng dụng giải trí. Nhưng Google Play có sự cân bằng hơn giữa ứng dụng giải trí và ứng dụng liên quan đời sống thực tế.

Để giảm mức độ cạnh tranh, chúng ta không nên phát triển ứng dụng Game vì có quá nhiều đối thủ (App Store hơn 58.16% là Game), thị trường Game đang bão hòa.

## Phân tích số lượng người dùng trung bình

Mục tiêu của chúng ta là tìm ra thể loại ứng dụng thu hút được nhiều người dùng nhất. Vì vậy chúng ta cần phân tích xem số lượng người dùng trung bình của mỗi thể loại ứng dụng là bao nhiêu.

- **Google Play:** Installs
- **App Store:** rating_count_tot, bởi vì App Store không có dữ liệu về lượt cài đặt nên chúng ta dùng rating_count_tot để thay thế.

*Note: Lý do mà tôi không dùng 'Tổng số lượng người dùng' để phân tích vì để tránh trường hợp có một vài ứng dụng quá xuất sắc ảnh hưởng đến nhận xét sai về một thể loại.*

### Số lượng người dùng trung bình mỗi thể loại trên Android

In [27]:
# Convert Installs column to number
df_android_english_free.Installs = df_android_english_free.Installs.str.replace('+','').str.replace(',','').astype(int)

In [28]:
# Calculate average installs of each category for Android
pd.DataFrame(round(df_android_english_free.groupby('Category')['Installs'].sum() / df_android_english_free.Category.value_counts())).sort_values(by=0, ascending=False).set_axis(['Average installs'],axis=1).style.format("{:,.0f}")

Unnamed: 0,Average installs
COMMUNICATION,38456119
VIDEO_PLAYERS,24727872
SOCIAL,23253652
PHOTOGRAPHY,17840110
PRODUCTIVITY,16787331
GAME,15588016
TRAVEL_AND_LOCAL,13984078
ENTERTAINMENT,11640706
TOOLS,10801391
NEWS_AND_MAGAZINES,9549178


Chúng ta có thể chọn Top 10 thể loại ứng dụng có lượt cài đặt trung bình cao nhất để đề xuất các nhà phát triển. Tuy nhiên hãy phân tích sâu hơn từng thể loại để tìm ra đâu là thể loại cần được ưu tiên.

### Phân tích các ứng dụng bên trong mỗi thể loại Android

#### Phần 1: Tìm các giá trị distinct trong cột Installs

Giá trị trong cột **Installs** của ứng dụng Android được liệt kê ở dạng tóm tắt (10,000+ | 100,000+ | 1,000,000+ | ...) nên chúng ta cần tìm xem có bao nhiêu giá trị distinct trong cột này. Sau đó chúng ta sẽ nhóm các ứng dụng lại dựa theo các giá trị distinct để phân tích.

In [29]:
# Distinct Value Installs
pd.DataFrame(df_android_english_free.Installs.drop_duplicates().sort_values(ascending=False).reset_index(drop=True)).style.format("{:,}")

Unnamed: 0,Installs
0,1000000000
1,500000000
2,100000000
3,50000000
4,10000000
5,5000000
6,1000000
7,500000
8,100000
9,50000


Chúng ta sẽ chọn ra 2 phân khúc để thuận tiện cho việc phân tích:
- **Phân khúc 1 - có lượt cài đặt cao nhất:** Installs => 100,000,000.
- **Phân khúc 2 - có lượt cài đặt trung bình (ở giữa):** 5,000,000 <= Installs <= 50,000,000.

#### Phần 2: Phân tích các ứng dụng bên trong mỗi thể loại

Các tiêu chí để chúng ta quyết định thể loại ứng dụng nào được ưu tiên phát triển.

1. Có nhiều hay ít ứng dụng trong phân khúc 1? Nếu quá nhiều ứng dụng thì thể loại đó không được ưu tiên vì nó quá cạnh tranh.
2. Có nhiều hay ít người khổng lồ đang chiếm lĩnh thị trường? Nếu quá nhiều người khổng lồ thì thể loại đó cũng không được ưu tiên.

Thể loại lý tưởng sẽ có có ít ứng dụng ở phân khúc 1 và không có nhiều người khổng lồ đang chiếm lĩnh thị trường.

In [30]:
# Show android apps by category
def show_android_apps(category):
    df = df_android_english_free
    cond_high = (df.Installs >= 100000000) & (df.Category == category)
    cond_middle = (df.Installs >= 5000000) & (df.Installs <= 50000000) & (df.Category == category)
    high = df[cond_high][['Installs','App']].sort_values(by='Installs', ascending=False).reset_index(drop=True)
    middle = df[cond_middle][['Installs','App']].sort_values(by='Installs', ascending=False).reset_index(drop=True)
    
    print(f'{"-"*88}\nAndroid | {category} - high installs: {high.shape[0]}\n{"-"*88}')
    for row in high.values:
        print(f'{row[0]:,} : {row[1]}')
    print(f'{"-"*88}\nAndroid | {category} - middle installs: {middle.shape[0]}\n{"-"*88}')
    for row in middle.values:
        print(f'{row[0]:,} : {row[1]}')
    print('\n')

In [31]:
# Check with COMMUNICATION category
show_android_apps('COMMUNICATION')

----------------------------------------------------------------------------------------------------
Android | COMMUNICATION - high installs: 27
----------------------------------------------------------------------------------------------------
1,000,000,000 : WhatsApp Messenger
1,000,000,000 : Skype - free IM & video calls
1,000,000,000 : Gmail
1,000,000,000 : Google Chrome: Fast & Secure
1,000,000,000 : Messenger – Text and Video Chat for Free
1,000,000,000 : Hangouts
500,000,000 : imo free video calls and chat
500,000,000 : Viber Messenger
500,000,000 : LINE: Free Calls & Messages
500,000,000 : UC Browser - Fast Download Private & Secure
500,000,000 : Google Duo - High Quality Video Calls
100,000,000 : Truecaller: Caller ID, SMS spam blocking & Dialer
100,000,000 : WeChat
100,000,000 : Yahoo Mail – Stay Organized
100,000,000 : UC Browser Mini -Tiny Fast Private & Secure
100,000,000 : imo beta free calls and text
100,000,000 : Who
100,000,000 : Android Messages
100,000,000 : Telegra

**COMMUNICATION:** Chúng ta thấy có quá nhiều ứng dụng trong phân khúc 1, và nhiều khổng lồ trong thể loại này như WhatsApp, Skype, Messenger, Hangouts,... Vì vậy chúng ta nên bỏ qua thể loại này.

Chúng ta sẽ phân tích tương tự với một các thể loại còn lại

In [32]:
# Show all apps by categories
show_android_apps('VIDEO_PLAYERS')
show_android_apps('SOCIAL')
show_android_apps('PHOTOGRAPHY')
show_android_apps('PRODUCTIVITY')
show_android_apps('GAME')
show_android_apps('TRAVEL_AND_LOCAL')
show_android_apps('ENTERTAINMENT')
show_android_apps('TOOLS')
show_android_apps('NEWS_AND_MAGAZINES')
show_android_apps('BOOKS_AND_REFERENCE')

----------------------------------------------------------------------------------------------------
Android | VIDEO_PLAYERS - high installs: 9
----------------------------------------------------------------------------------------------------
1,000,000,000 : Google Play Movies & TV
1,000,000,000 : YouTube
500,000,000 : MX Player
100,000,000 : Dubsmash
100,000,000 : Motorola FM Radio
100,000,000 : Motorola Gallery
100,000,000 : VLC for Android
100,000,000 : VideoShow-Video Editor, Video Maker, Beauty Camera
100,000,000 : VivaVideo - Video Editor & Photo Movie
----------------------------------------------------------------------------------------------------
Android | VIDEO_PLAYERS - middle installs: 43
----------------------------------------------------------------------------------------------------
50,000,000 : MiniMovie - Free Video and Slideshow Editor
50,000,000 : Ringdroid
50,000,000 : LIKE – Magic Video Maker & Community
50,000,000 : Vote for
50,000,000 : Vigo Video
50,000,00

**VIDEO_PLAYERS (Yes)**
- Không nhiều ứng dụng nằm ở phân khúc 1 (chỉ 9 ứng dụng), đứng đầu là những người khổng lồ như YouTube, Google Play.
- Không có quá nhiều người không lồ khi xem tổng thể cả 2 phân khúc.
- Ngoài trình xem video ra còn có nhiều kiểu ứng dụng liên quan đến video khác như tải video, trình sửa video.

*--> Đây là một thể loại có tiềm năng cho chúng ta phát triển. Tôi đề xuất ứng dụng tải video tất cả các mạng xã hội và ứng dụng xem video thông qua YouTube nhưng không có quảng cáo gây gián đoạn, tất nhiên quảng cáo của chúng ta sẽ hiển thị một vị trí nào nó không ảnh hưởng người dùng.*

**SOCIAL (No)**

Nhìn chung thì những người khổng lồ đã chiếm hết thị trường của thể loại này. Việc thu hút ngươi dùng sử dụng một mạng xã hội mới mất rất nhiều công sức và chi phí, chúng ta nên bỏ qua thể loại này.

**PHOTOGRAPHY (Yes)**
- Có nhiều ứng dụng ở phân khúc 1 nhưng nhìn chung thì không có sự chi phối bởi những người không lồ. Vì vậy phân 2 vẫn còn cơ hội cho chúng ta.
- Kho ứng dụng nhiếp ảnh trên Google Play đủ đáp ứng hầu hết nhu cầu dùng, chúng ta cần tìm ra những nhu cầu mới của người dùng và phát triển những tính năng khác biệt mới có thể thu hút được người dùng.

*--> Tôi đề xuất một ứng dụng tự động xuất ra nhiều hình ảnh theo kích thước của tất cả các mạng xã hội trên thế giới, họ có thể chia sẻ hình ảnh lên các mạng xã hội với từng kích thước riêng để chúng hiển thị đẹp nhất ngay trong ứng dụng của chúng ta. Đồng thời có thể giúp họ thêm các lớp filter theo mùa, theo trend hoặc ngày lễ hội.*

**PRODUCTIVITY (Yes)**
- Phân khúc 1 đã có nhiều người không lồ chiếm lĩnh.
- Nhưng phân khúc 2 thì không có nhiều người khổng lồ, chúng ta có cơ hội phát triển ở phân khúc này.

*--> Tôi gợi ý một ứng dụng tích hợp hết mọi thứ có thể hỗ trợ PDF (convert to image, convert to text, convert to audio, tách một trang ra hoặc gộp nhiều trang lại, chỉnh sửa DPF, nén dung lượng PDF,...). Có rất nhiều nhu cầu của người dùng đối với PDF khi tìm hiểu bằng Google Keyword Suggest, việc chúng ta là tổng hợp tất cả nhu cầu lại và phát triển nó thành 1 ứng dụng chuyên nghiệp.*

**GAME (Yes)**

- Ở phân tích đầu tiên chúng ta đã đề xuất không phát triển thể loại trò chơi nữa vì có quá nhiều đối thủ và thị trường đang bão hòa.
- Nhưng chúng ta sẽ đi một ngách khác ít cạnh tranh hơn để không bỏ qua người dùng ở thể này, đó là những cuốn cẩm nang chiến thuật chơi game.

*--> Chúng ta có thể phát triển các ứng dụng cẩm nang để chơi các trò chơi khó. Khi người dùng tiềm kiếm một trò chơi, họ sẽ dễ tìm thấy ứng dụng chúng ta vì từ khóa giống nhau, ví dụ khi họ tìm `Wild Rift`, họ có thể thấy `Cẩm nang Wild Rift` của chúng ta.*

*Việc của chúng ta cần làm là thu thập các trò chơi mang tính chiến thuật được nhiều người chơi nhất rồi tổng hợp các bí kiếp từ trên mạng thành một ứng dụng thú vị.*

**TRAVEL_AND_LOCAL (No)**
- Các ứng dụng trong thể loại này đỏi hỏi phải có kết nối API như bản đồ, điều này sẽ làm tăng chi phí.
- Mặc dù không có nhiều ứng dụng trong phân khúc 1 và không có nhiều người khổng lồ trong thể loại, nhưng một công ty không liên quan đến du lịch như chúng ta sẽ khó phát triển được trong thể loại này.

**ENTERTAINMENT (No)**

- Mặc dù không có nhiều ứng dụng trong phân khúc 1 và không có nhiều người khổng lồ trong thể loại, nhưng thể loại này lại khó để cạnh tranh.
- Bạn có thể thấy hầu hết các ứng dụng trong thể loại này liên quan đến xem phim trực tuyến. Nếu đầu tư vào kiểu ứng dụng này có thể khiến chúng ta mất nhiều chi phí như máy chủ để chứa phim. Nếu làm việc một cách đàng hoàng chúng ta còn phải mất chi phí bản quyền các bộ phim. Vì vậy tôi đề xuất chúng ta nên bỏ qua thể loại này.

**TOOLS (Yes)**
- Thể loại này rất đa dạng về ứng dụng, không bị những người khổng lồ chiếm lĩnh thị trường.
- Để cạnh tranh ở thể loại này thì việc quan trọng là tìm ra nhu cầu mới của người dùng, hoặc những cải tiến vượt bậc so với các ứng dụng đang có trên Google Play.

*--> Chúng ta có khả năng cạnh tranh ở phân khúc 2 của thể loại này.*

**NEWS_AND_MAGAZINES (No)**

Không có nhiều ứng dụng ở phân khúc 1, nhưng thể loại này cũng giống như ENTERTAINMENT. Chúng ta phải sản xuất nội dung online liên tục và cũng tốn chi phí không ít, một công ty viết ứng dụng rất khó cạnh tranh với các nhà báo về thể loại này. Vì vậy tôi đề xuất bỏ qua thể loại này.

**BOOKS_AND_REFERENCE (Yes)**
- Không có nhiều ứng dụng ở phân khúc 1. Nhìn chung ta có thể nhận ra rằng các ứng dụng chủ yếu trong thể loại này là dịch thuật, đọc sách online, một quyển sách nào đó.
- Một quyển sách offline sẽ có nhiều cơ hội cho công ty của chúng ta hơn, nó cũng không đòi hỏi quá nhiều chi phí.

*--> Tôi đề xuất phát triển các ứng dụng để đọc offline một quyển sách nổi tiếng nào đó. Hãy thêm nhiều tính năng hơn là một quyền sách thô, chẳng hạn như tăng - giảm kích cỡ chữ, lưu lại nơi đã đọc, highlight những câu trong sách, hiệu ứng lật trang sách, hoặc tuyệt vời hơn nữa là tính năng nghe audio offline của quyển sách đó.*

#### Kết quả
Chúng ta đã chọn được 6 thể loại ứng dụng trên Google Play để cho các nhà phát triển.

1. VIDEO_PLAYERS
2. PHOTOGRAPHY
3. PRODUCTIVITY
4. GAME (Cẩm nang)
5. TOOLS
6. BOOKS_AND_REFERENCE

Nhưng chúng ta phải ưu tiên những thể loại thu hút nhiều người dùng trên cả 2 hệ điều hành Android và IOS, vì vậy hãy phân tích tiếp lượt đánh giá trung bình mỗi thể loại trên IOS để tìm ra thứ tự ưu tiên cho các thể loại ứng dụng.

### Số lượng đánh giá trung bình mỗi thể loại trên IOS

In [33]:
# Average Rating on App Store
pd.DataFrame(round(df_ios_english_free.groupby('prime_genre')['rating_count_tot'].sum() / df_ios_english_free.prime_genre.value_counts())).sort_values(by=0, ascending=False).set_axis(['Average ratings'],axis=1).style.format("{:,.0f}")

Unnamed: 0,Average ratings
Navigation,86090
Reference,74942
Social Networking,71548
Music,57327
Weather,52280
Book,39758
Food & Drink,33334
Finance,31468
Photo & Video,28442
Travel,28244


Nhìn vào Top 10 thể loại ứng dụng có lượt đánh giá trung bình cao nhất, chúng ta có thể thấy **Book** và **Photo & Video** là phù hợp với 6 thể loại đã chọn ở Google Play. Bây giờ chúng ta sẽ phân tích cụ thể từng thể loại.

In [34]:
# Show IOS apps by genre
def show_ios_apps(genre):
    df = df_ios_english_free
    cond = df.prime_genre == genre
    df_flltered = df[cond][['rating_count_tot','track_name']].sort_values(by='rating_count_tot', ascending=False).reset_index(drop=True)
    print(f'{"-"*88}\nIOS | {genre}: {df_flltered.shape[0]}\n{"-"*88}')
    for row in df_flltered.values:
        print(f'{row[0]:,} : {row[1]}')
    print('\n')

In [35]:
# Show all apps by genres
show_ios_apps('Navigation')
show_ios_apps('Reference')
show_ios_apps('Social Networking')
show_ios_apps('Music')
show_ios_apps('Weather')
show_ios_apps('Book')
show_ios_apps('Food & Drink')
show_ios_apps('Finance')
show_ios_apps('Photo & Video')
show_ios_apps('Travel')

----------------------------------------------------------------------------------------------------
IOS | Navigation: 6
----------------------------------------------------------------------------------------------------
345,046 : Waze - GPS Navigation, Maps & Real-time Traffic
154,911 : Google Maps - Navigation & Transit
12,811 : Geocaching®
3,582 : CoPilot GPS – Car Navigation & Offline Maps
187 : ImmobilienScout24: Real Estate Search in Germany
5 : Railway Route Search


----------------------------------------------------------------------------------------------------
IOS | Reference: 18
----------------------------------------------------------------------------------------------------
985,920 : Bible
200,047 : Dictionary.com Dictionary & Thesaurus
54,175 : Dictionary.com Dictionary & Thesaurus for iPad
26,786 : Google Translate
18,418 : Muslim Pro: Ramadan 2017 Prayer Times, Azan, Quran
17,588 : New Furniture Mods - Pocket Wiki & Game Tools for Minecraft PC Edition
16,849 : Mer

**Navigation (No)**

Có khá ít ứng dụng trong thể loại này nhưng chủ yếu chúng là ứng dụng bản đồ, việc phát triển một ứng dụng bản đồ sẽ mất rất nhiều chi phí như API chẳng hạn. Vì vậy chúng ta nên bỏ qua thể lại này.

**Reference (Yes)**

Thể loại này là hỗn hợp giữa sách, dịch thuật, và một vài trò chơi. Nhưng có thẻ thấy rằng quyển sách Bible được nhiều lượt đánh giá nhất.

*--> Thể loại này như một lần nữa ủng hộ đề xuất của tôi về việc chuyển các quyển sách nổi tiếng thành ứng dụng offline.*

**Social Networking (No)**

Tương tự như thể loại COMMUNICATION của Google Play, có quá nhiều người không lồ đang thống trị thể loại này. Chúng ta nên bỏ qua.

**Music (Yes)**

- Nếu làm một trình nghe nhạc online, chúng ta sẽ mất nhiều chi phí để lưu trữ bài hát.
- Nhưng nếu làm một trình nghe nhạc offline thì cũng khó tiếp cận được người dùng vì IOS bị hạn chế chia sẻ nhạc giữa các ứng dụng khác nhau.
- Nếu như có thể làm một trình nghe nhạc online mà dựa vào nguồn khác như YouTube thì có thể tiếp cận được người dùng hơn.

*--> Xem lại phân tích thể loại VIDEO_PLAYERS của Google Play, tôi đã đề xuất một ứng dụng xem video YouTube không quảng cáo, bây giờ chúng ta có thể bổ sung thêm một vài tính năng lên quan đến nghe nhạc từ YouTube, ví dụ như người dùng có thể nghe nhạc YouTube trong khi tắt màn hình điện thoại.*

**Weather (No)**
- Phát triển các ứng dụng thời tiết cũng mất nhiều chi phí về API.
- Người dùng cũng rất ít khi mở ứng dụng thời tiết ra để xem, mà doanh thu của chúng ta đến từ hiển thị quảng cáo trong ứng dụng.

Vì vậy chúng ta nên bỏ qua thể loại này.

**Book (Yes)**

Có thể thấy một vài quyển sách đã được chuyển thành ứng dụng trong thể loại này, nhưng không nhiều. Chúng ta sẽ chọn thể loại này vì chúng ta phân tích và đề xuất ứng dụng rồi.

**Food & Drink (No)**

Hầu các ứng dụng trong thể loại liên quan đến giao hàng, và đặt thức ăn online. Thể loại này không phù hợp với công ty của chúng ta.

**Finance (No)**

Các ứng dụng trong thể loại này đều liên quan đến tài chính và ngân hàng, đây không phải là một điểm mạnh của công ty chúng ta.

**Photo & Video (Yes)**

Chúng ta đã chọn thể loại PHOTOGRAPHY khi phân tích ứng dụng trên Google Play và đã có đề xuất ý tưởng ứng dụng.

**Travel (No)**

Tương tự như phân tích về thể loại TRAVEL_AND_LOCAL của Google Play, nên chúng ta sẽ bỏ qua thể loại này.

#### Kết quả
Chúng ta đã chọn được 4 thể loại ứng dụng trên App Store cho các nhà phát triển.
1. Reference
2. Music
3. Book
4. Photo & Video

## Tóm lại các đề xuất

### Các thể loại ứng dụng được ưu tiên

Các thể loại này sẽ được ưu tiên phát triển vì chúng có ứng dụng giống nhau và đều thu hút nhiều người dùng nhất trên cả 2 hệ điều hành.

**VIDEO_PLAYERS | Music**

Ứng dụng đề xuất là trình xem video và nghe nhạc từ nguồn của YouTube, không có quảng cáo gây gián đoạn, người dùng có thể nghe nhạc từ YouTube khi tắt màn hình điện thoại.

**PHOTOGRAPHY | Photo & Video**

Ứng dụng tự động xuất ra nhiều hình ảnh theo kích thước của tất cả các mạng xã hội trên thế giới, họ có thể chia sẻ hình ảnh lên các mạng xã hội với từng kích thước riêng để chúng hiển thị đẹp nhất ngay trong ứng dụng của chúng ta. Đồng thời có thể giúp họ thêm các lớp filter theo mùa, theo trend hoặc ngày lễ hội.

**BOOKS_AND_REFERENCE | Reference, Book**

Ứng dụng để đọc offline một quyển sách nổi tiếng nào đó. Hãy thêm nhiều tính năng hơn là một quyền sách thô, chẳng hạn như tăng - giảm kích cỡ chữ, lưu lại nơi đã đọc, highlight những câu trong sách, hiệu ứng lật trang sách, hoặc tuyệt vời hơn nữa là tính năng nghe audio offline của quyển sách đó.

### Các thể loại ứng dụng dự phòng

**PRODUCTIVITY**

Ứng dụng tích hợp hết mọi thứ có thể hỗ trợ PDF (convert to image, convert to text, convert to audio, tách một trang ra hoặc gộp nhiều trang lại, chỉnh sửa DPF, nén dung lượng PDF,...) có rất nhiều nhu cầu của người dùng đối với PDF, việc chúng ta cần là tổng hợp tất cả nhu cầu lại và phát triển nó thành 1 ứng dụng miễn phí.

**GAME**

Ứng dụng cẩm nang để chơi các trò chơi khó. Khi người dùng tiềm kiếm tên của một trò chơi, họ sẽ dễ dàng tìm thấy chúng ta nếu như tên của ứng dụng cũng chứa từ khóa là tên của trò chơi đó. Ví dụ khi họ tìm trò chơi Wild Rift, họ có thể thấy Cẩm nang Wild Rift của chúng ta. Việc của chúng ta cần làm là thu thập các trò chơi mang tính chiến thuật được nhiều người chơi nhất rồi tổng hợp các bí kiếp từ trên mạng thành một ứng dụng.

**TOOLS**

Cần nghiên cứu các hành vi và nhu cầu người dùng để sáng tạo ra các tool phù hợp.

## Phần kết luận

Với mục tiêu tìm ra các thể loại ứng dụng thu hút nhiều người dùng nhất để tăng lợi nhuận từ quảng bên trong ứng dụng miễn phí, chúng ta đã tìm được 6 thể loại ứng dụng, trong đó ưu tiên hàng đầu là Video or Music, Photography, Book sếp sau cùng là Productivity, Game, Tools. Ngoài ra chúng cũng đã gợi ý sẵn một vài ý tưởng ứng dụng cho các nhà phát triển.