# MongoDB with pymongo
Pada file ini akan dilakukan practice case dengan menggunakan pymongo. PyMongo sendiri merupakan distribusi Python yang berisi *tools* untuk bekerja dengan MongoDB, dan merupakan cara yang disarankan untuk bekerja dengan MongoDB dari Python.<br><br>

Practice yang akan dilakukan adalah dengan cara membuat collection baru dengan nama clean_movies yang sama persis dengan movies collection pada database sample_mflix dengan memakai collection movies_intial (projecting_queries pymongo). Setelah itu, akan divalidasi collection yang telah dibuat dengan parameter sebagai berikut :<br> 
- Semua document pada clean_movies dan movie sama,
- Banyak document pada clean_movies dan movie sama, 
- Semua fields pada clean_movies ada pada movie,
- Semua value pada clean_movies sama dengan semua value pada movies dengan urutan yang sama
<br><br>

## Outline :

<ul>

<li><a href="#no1">1. Movies_Initial Collection Part</a></li>
  
<li><a href="#no2">2. Movies Collection Part</a></li>
  
<li><a href="#no3">3. Matching Collection</a></li>
  
<li><a href="#no4">4. Pipeline aggregation framework and Projecting Queries</a></li>
  
<li><a href="#no5">5. Validation</a></li>
  
<li><a href="#no6">6. Conclusion</a></li>
  
</ul>



# GETTING STARTED WITH PYMONGO

<a id='no1'></a>
# 1. Movies_Initial Collection Part

## 1.1 Import package

In [1]:
import pymongo
from pymongo import MongoClient
import pprint
from IPython.display import clear_output

## 1.2 Connect to MongoDB Cluster

In [2]:
client = MongoClient("mongodb+srv://admin1234:12345@cluster0-miqju.gcp.mongodb.net/test?retryWrites=true&w=majority")
print(client)

MongoClient(host=['cluster0-shard-00-02-miqju.gcp.mongodb.net:27017', 'cluster0-shard-00-01-miqju.gcp.mongodb.net:27017', 'cluster0-shard-00-00-miqju.gcp.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='Cluster0-shard-0', ssl=True)


## 1.3 List all database names from Client

In [241]:
print(client.list_database_names())

['sample_mflix', 'admin', 'local']


## 1.4 List all collection names from sample_mflix database

In [238]:
db.list_collection_names()

['clean_movies_Putrisqiana',
 'clean_movies_tara',
 'clean_movies_bunga',
 'clean_movies_zumar',
 'movies_initial',
 'clean_movies_putrisqiana',
 'clean_movies_firdaus',
 'clean_movies_dwilaras',
 'clean_movies_nurlailiis',
 'clean_movies_faizah']

## 1.5 Initialize clean_movies with client database and clean_movies collection

In [4]:
db = client['sample_mflix']
clean_movies = db.movies_initial

## 1.6 List all keys in clean_movies

In [99]:
clean_movies.find_one().keys()

dict_keys(['_id', 'imdbID', 'title', 'year', 'rating', 'runtime', 'genre', 'released', 'director', 'writer', 'cast', 'metacritic', 'imdbRating', 'imdbVotes', 'poster', 'plot', 'fullplot', 'language', 'country', 'awards', 'lastupdated', 'type'])

## 1.7 View documents in clean_movies collection

In [6]:
clean_movies.find_one()

{'_id': ObjectId('5daffb1b986c4adedb754af9'),
 'awards': '',
 'cast': 'Carmencita',
 'country': 'USA',
 'director': 'William K.L. Dickson',
 'fullplot': 'Performing on what looks like a small wooden stage, wearing a dress with a hoop skirt and white high-heeled pumps, Carmencita does a dance with kicks and twirls, a smile always on her face.',
 'genre': 'Documentary, Short',
 'imdbID': 1,
 'imdbRating': 5.9,
 'imdbVotes': 1032,
 'language': '',
 'lastupdated': '2015-08-26 00:03:45.040000000',
 'metacritic': '',
 'plot': 'Performing on what looks like a small wooden stage, wearing a dress with a hoop skirt and white high-heeled pumps, Carmencita does a dance with kicks and twirls, a smile always on her face.',
 'poster': 'http://ia.media-imdb.com/images/M/MV5BMjAzNDEwMzk3OV5BMl5BanBnXkFtZTcwOTk4OTM5Ng@@._V1_SX300.jpg',
 'rating': 'NOT RATED',
 'released': '',
 'runtime': '1 min',
 'title': 'Carmencita',
 'type': 'movie',
 'writer': '',
 'year': 1894}

## 1.8 View length of clean_movies

In [7]:
len(list(clean_movies.find({})))

46014

<a id='no2'></a>
# 2. Movies Collection Part

## 2.1 Connect to MongoDB Cluster

In [8]:
client2 = MongoClient("mongodb+srv://userstudent:admin1234@cluster0-nnbxe.gcp.mongodb.net/test?retryWrites=true&w=majority")
print(client2)

MongoClient(host=['cluster0-shard-00-01-nnbxe.gcp.mongodb.net:27017', 'cluster0-shard-00-02-nnbxe.gcp.mongodb.net:27017', 'cluster0-shard-00-00-nnbxe.gcp.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='Cluster0-shard-0', ssl=True)


## 2.2 List all database names from client2

In [245]:
print(client2.list_database_names())

['sample_mflix', 'admin', 'local']


## 2.3 List all collection names from sample_mflix database

In [242]:
dbmovies.list_collection_names()

['clean_movies_dwilaras',
 'clean_movies_nurlailiis',
 'clean_movies_devita',
 'movies_initial',
 'clean_movies_frans',
 'clean_movies_tara',
 'clean_movies_tunggal',
 'clean_movies',
 'users',
 'clean_movies_nurrimah',
 'movies_testtopik',
 'movies_scratch',
 'clean_movies_topik',
 'movies',
 'clean_movies_afifah',
 'clean_movies_andreas',
 'clean_movies_indra_1']

## 2.4 Initialize movies with client2 database and movies collection

In [10]:
dbmovies = client2['sample_mflix']
movies = dbmovies.movies

## 2.5 List all keys on documents

In [243]:
movies.find_one().keys()

dict_keys(['_id', 'plot', 'genres', 'runtime', 'cast', 'num_mflix_comments', 'poster', 'title', 'fullplot', 'countries', 'released', 'directors', 'writers', 'awards', 'lastupdated', 'year', 'imdb', 'type', 'tomatoes'])

## 2.6 View documents in movies collection

In [244]:
movies.find_one()

{'_id': ObjectId('573a1390f29313caabcd5a93'),
 'awards': {'nominations': 0, 'text': '1 win.', 'wins': 1},
 'cast': ['Howard C. Hickman', 'Enid Markey', 'Lola May', 'Kate Bruce'],
 'countries': ['USA'],
 'directors': ['Reginald Barker',
  'Thomas H. Ince',
  'Raymond B. West',
  'Walter Edwards',
  'David Hartford',
  'Jay Hunt',
  'J. Parker Read Jr.'],
 'fullplot': 'Allegorical film about peace. A king starts a war, many of the women are against it, people are pressed into service. A count has constructed a submarine and gets the order to sink an ocean liner, that is also carrying - supposedly - ammunition for the enemy. The count refuses to fire the torpedos, and sinks the submarine. He survives, but in a limbo between death and life where he meets Jesus, who takes him over to preach peace. Naturally the king arrests him and sentences him to death for treason, but then Jesus shows him the real face of war.',
 'genres': ['Drama'],
 'imdb': {'id': 6517, 'rating': 6.3, 'votes': 162},
 '

## 2.7 View length of movies collection

In [12]:
len(list(movies.find({})))

23541

<a id='no3'></a>
# 3. Matching collection

Langkah ini dilakukan untuk menyamakan *document value* pada *collection* clean_movies dan *collection* movies.<br>
Dibawah ini merupakan code untuk mengambil data imdb dari movies untuk mendapatkan format list array yang akan digunakan pada clean_movies. Sehingga *document value* yang ada pada clean_movies akan sama formatnya dengan movies.

In [247]:
imdb = list(movies.find({},{'_id': 0, 'imdb':1}))
imdb_list = []
for tit in imdb:
    imdb_list.append(list(tit.values())[0])
imdb_list[:5]

[{'id': 6517, 'rating': 6.3, 'votes': 162},
 {'id': 8133, 'rating': 7.8, 'votes': 4680},
 {'id': 12512, 'rating': 6.8, 'votes': 489},
 {'id': 13025, 'rating': 7.8, 'votes': 3738},
 {'id': 15498, 'rating': 7.1, 'votes': 327}]

<a id='no4'></a>
# 4. Pipeline aggregation framework and Projecting Queries

In [207]:
pipeline = [
    {
        '$project': {
            '_id' : 1,
            'awards': {'nominations': {'$arrayElemAt':[{'$split':[{'$arrayElemAt':[{'$split': [ "$awards", " nomination" ]}, -2]},' ']},-1]},
                       'text': "$awards",
                       'wins': {'$arrayElemAt':[{'$split':[{'$arrayElemAt':[{'$split': [ "$awards", " win" ]}, -2]},' ']},-1]}
                      },
            'cast': {'$split': ["$cast", ", "]},
            'countries': {'$split': ["$country", ", "]},
            'directors': {'$split': ["$director", ", "]},
            'genres': {'$split': ["$genre", ", "]},
            'fullPlot': "$fullplot",
            'imdb': {
                'id': "$imdbID",
                'rating': "$imdbRating",
                'votes': "$imdbVotes"
                },
            'languages' : "$language",
            'lastupdated': "$lastupdated",
            'metacritic' : "$metacritic",
            'num_mflix_comment' : "",
            'plot': 1,
            'poster': 1,
            'rated' : "$rating",
            'released': { '$concat': [ "datetime.datetime(", 
                                      {'$arrayElemAt':[{'$split': [ "$released", "-" ]}, 0]},
                                      ", ",
                                      {'$arrayElemAt':[{'$split': [ "$released", "-" ]}, 1]},
                                      ", ",
                                      {'$arrayElemAt':[{'$split': [ "$released", "-" ]}, 2]},
                                      ", 0, 0)" ] },
            'runtime': {"$cond": [{'$eq': ["$runtime", ""]}, 0 ,{'$arrayElemAt':[{'$split': [ "$runtime", " min" ]}, 0]}]},
            'title': 1,
            'tomatoes' :{
                'lastUpdated': { '$concat': [ "datetime.datetime(", 
                                      {'$arrayElemAt':[{'$split': [ "$lastupdated", "-" ]}, 0]},
                                      ", ",
                                      {'$arrayElemAt':[{'$split': [ "$lastupdated", "-" ]}, 1]},
                                      ", ",
                                      {'$arrayElemAt':[{'$split': [ "$lastupdated", "-" ]}, 2]},
                                       ",)"
                                            ] },
                'viewer': {'meter':'', 'numReviews':'', 'rating':''},
                'dvd':'',
                'fresh':'',
                'rotten':'',
                'production':''
            },
            'type': 1,
            'writers': {'$split': ["$writer", ", "]},
            'year':1
        }
    },{"$match" : {"imdb" : {"$in" : [dict(sorted(imdb_list[x].items(), key=lambda x: x[0])) for x in range(len(imdb_list))]}}},
    {
        ### naming the new collection as output ### 
        '$out': "clean_movies_bunga"
    }
]

clear_output()
pprint.pprint(list(client.sample_mflix.movies_initial.aggregate(pipeline)))

[]


Stage Pertama: Melakukan projection <br>
- Menampilkan nilai dari beberapa keys yang memiliki nilai yang sama dengan nilai yang ada di movies_initial, yaitu keys id, cast, country, directors, genres, fullPlot, languages, lastupdated, metacritic, plot, poster, rated, title, type, dan year.
- Memisahkan element array pada keys awards untuk dimasukkan dalam sub keys nomination, text, dan wins<br>
- Mengambil nilai dari imdbID, imdbRating, dan imdbVotes dan memasukkannya kedalam sub keys, lalu digabungkan menajadi satu keys yaitu imdb<br>
- Membuat keys baru yaitu num_flix_comment dengan nilai kosong (Hal in disebabkan karena pada clean_movies_bunga tidak memiliki data num_mflix_comment akan tetapi pada movies terdapat data num_mflix_comment<br>
- Menggabungkan beberapa array berisi tanggal dengan memisahkan element array dari tanggal untuk diambil nilainya dan dimasukkan dalam keys released<br>
- Pada keys runtime apabila terdapat runtime pada movies collection makan akan ditampilkan nilai runtimenya, namun apabila tidak ada, tidak akan ditampilkan<br>
- Membuat keys totmatoes yang memiliki beberapa sub-keys lastUpdated yang mengambil nilai dengan memisahkan array element dari lastupdated, dan beberapa sub-keys lainnya yang tidak memiliki data karena tidak terdapat data pada clean_movies_bunga collection akan tetapi pada movies terdapat data tersebut<br><br>
Stage Kedua: Menyamakan Data<br>
Karena data yang ada pada movies_initial tidak semuanya ada pada movies, sehingga dilakukan penyamaan data menggunakan "$match" agar data pada movies_initial bisa sama dengan movies. Penyamaan data ini dilakukan dengan mengambil nilai dari data imdb.<br><br>
Stage Ketiga: Membuat nama *collection* yang baru sebagai *output* dengan nama clean_movies_bunga<br><br>
Setelah itu membuat *collection* baru dengan sumber data dari database mflix dan movies_initial *collection*

## 4.1 Check whether the collection has been made on the database

In [91]:
db.list_collection_names()

['clean_movies_Putrisqiana',
 'clean_movies_tara',
 'clean_movies_bunga',
 'clean_movies_zumar',
 'movies_initial',
 'clean_movies_putrisqiana',
 'clean_movies_firdaus',
 'clean_movies_dwilaras',
 'clean_movies_nurlailiis',
 'clean_movies_faizah']

    ^^^ clean_movies_bunga telah ada pada sample_mflix database

## 4.2 Initialize col with client2 database and clean_movies_bunga collection

In [208]:
dbmov = client['sample_mflix']
col = dbmov.clean_movies_bunga

## 4.3 View documents in clean_movies_bunga collection

In [209]:
col.find_one()

{'_id': ObjectId('5daffb1b986c4adedb754afa'),
 'awards': {'nominations': None, 'text': '1 win.', 'wins': '1'},
 'cast': ['Charles Kayser', 'John Ott'],
 'countries': ['USA'],
 'directors': ['William K.L. Dickson'],
 'fullPlot': 'A stationary camera looks at a large anvil with a blacksmith behind it and one on either side. The smith in the middle draws a heated metal rod from the fire, places it on the anvil, and all three begin a rhythmic hammering. After several blows, the metal goes back in the fire. One smith pulls out a bottle of beer, and they each take a swig. Then, out comes the glowing metal and the hammering resumes.',
 'genres': ['Short'],
 'imdb': {'id': 5, 'rating': 6.2, 'votes': 1189},
 'languages': '',
 'lastupdated': '2015-08-26 00:03:50.133000000',
 'metacritic': '',
 'num_mflix_comment': '',
 'plot': 'Three men hammer on an anvil and pass a bottle of beer around.',
 'poster': '',
 'rated': 'UNRATED',
 'released': 'datetime.datetime(1893, 05, 09, 0, 0)',
 'runtime': '1'

<a id='no5'></a>
# 5. Validation

## 5.1 View length of clean_movies_bunga collection

In [119]:
len(list(col.find()))

23539

## 5.2 View length of movies collection

In [121]:
len(list(movies.find({})))

23541

Dapat diketahui bahwa ternyata jumlah data dari kedua collection berbeda, hal ini disebabkan karena terdapat data yang *redundant* pada movies collection, hal ini dapat di cek dengan cara berikut ini :

## 5.3 Check what documents make clean_movies_bunga collection and movies collection different

Cara yang saya lakukan untuk mengetahui dokumen apa yang membuat kedua koleksi memiliki jumlah data yang berbeda adalah dengan mengelompokkan kedua koleksi dan mengurutkan dokumen didalamnya berdasarkan "imdb" *key*.

In [122]:
checkcleanmovies = list(db['clean_movies_bunga'].aggregate([{'$sortByCount':'$imdb'}]))
checkmovies = list(dbmovies['movies'].aggregate([{'$sortByCount':'$imdb'}]))

Dengan mengecek *values* pada imdb akan terlihat bahwa ternyata terdapat 2 dokumen yang berbeda tapi merupakan dokumen yang sama  yaitu dokumen dengan id: 5, rating: 6.2, votes: 1189. Ini artinya bahwa ternyata pada movies *collection* terdapat redudansi data. Hal ini yang menyebabkan jumlah data di movies *collection* dan clean_movies_bunga *collection* berbeda.

In [129]:
for doc1 in checkmovies:
  if doc1 not in checkcleanmovies:
    print(doc1)

{'_id': {'id': 5, 'rating': 6.2, 'votes': 1189}, 'count': 2}


Untuk memastikan bahwa kedua koleksi memiliki data yang sama, mari lihat isi dari dokumen yang memiliki redudansi data pada movies *collection* dan clean_movies_bunga *collection*

In [210]:
list(db['clean_movies_bunga'].find({'imdb':{'id': 5, 'rating': 6.2, 'votes': 1189}}))

[{'_id': ObjectId('5daffb1b986c4adedb754afa'),
  'awards': {'nominations': None, 'text': '1 win.', 'wins': '1'},
  'cast': ['Charles Kayser', 'John Ott'],
  'countries': ['USA'],
  'directors': ['William K.L. Dickson'],
  'fullPlot': 'A stationary camera looks at a large anvil with a blacksmith behind it and one on either side. The smith in the middle draws a heated metal rod from the fire, places it on the anvil, and all three begin a rhythmic hammering. After several blows, the metal goes back in the fire. One smith pulls out a bottle of beer, and they each take a swig. Then, out comes the glowing metal and the hammering resumes.',
  'genres': ['Short'],
  'imdb': {'id': 5, 'rating': 6.2, 'votes': 1189},
  'languages': '',
  'lastupdated': '2015-08-26 00:03:50.133000000',
  'metacritic': '',
  'num_mflix_comment': '',
  'plot': 'Three men hammer on an anvil and pass a bottle of beer around.',
  'poster': '',
  'rated': 'UNRATED',
  'released': 'datetime.datetime(1893, 05, 09, 0, 0)',

In [211]:
list(dbmovies['movies'].find({'imdb':{'id': 5, 'rating': 6.2, 'votes': 1189}}))

[{'_id': ObjectId('5dafd0d3d75e5fa8b23dae21'),
  'awards': {'nominations': 0, 'text': '1 win.', 'wins': 1},
  'cast': ['Charles Kayser', 'John Ott'],
  'countries': ['USA'],
  'directors': ['William K.L. Dickson'],
  'fullplot': 'A stationary camera looks at a large anvil with a blacksmith behind it and one on either side. The smith in the middle draws a heated metal rod from the fire, places it on the anvil, and all three begin a rhythmic hammering. After several blows, the metal goes back in the fire. One smith pulls out a bottle of beer, and they each take a swig. Then, out comes the glowing metal and the hammering resumes.',
  'genres': ['Short', 'Long'],
  'imdb': {'id': 5, 'rating': 6.2, 'votes': 1189},
  'lastupdated': '2015-08-26 00:03:50.133000000',
  'num_mflix_comments': 1,
  'plot': 'Three men hammer on an anvil and pass a bottle of beer around.',
  'rated': 'UNRATED',
  'released': datetime.datetime(1893, 5, 9, 0, 0),
  'runtime': 1,
  'title': 'Blacksmith Scene II',
  'to

    Dapat diketahui bahwa ternyata pada movies *collection* dan clean_movies_bunga *collection* memiliki data yang sama.

## 5.4 Validate keys from movies *collection* dan clean_movies_bunga *collection*

In [212]:
list(col.find_one().keys())

['_id',
 'title',
 'year',
 'poster',
 'plot',
 'awards',
 'type',
 'cast',
 'countries',
 'directors',
 'genres',
 'fullPlot',
 'imdb',
 'languages',
 'lastupdated',
 'metacritic',
 'num_mflix_comment',
 'rated',
 'released',
 'runtime',
 'tomatoes',
 'writers']

Pada movies *collection* apabila cari *keys*-nya secara *random* akan memiliki jumlah yang berbeda-beda. Hal ini disebabkan karena adanya perbedaan data yang ada, misal pada dokumen 1 terdapat *kets writers* akan tetapi pada dokumen 2 tidak terdapat keys *writers*. Oleh karena itu saya mengambil *keys* dari dokumen yang memiliki *keys* yang paling lengkap.

In [220]:
keys_movies = [list(doc.keys()) for doc in col.find({})]
keys_movies = set([j for i in keys_movies for j in i])
keys_movies

{'_id',
 'awards',
 'cast',
 'countries',
 'directors',
 'fullPlot',
 'genres',
 'imdb',
 'languages',
 'lastupdated',
 'metacritic',
 'num_mflix_comment',
 'plot',
 'poster',
 'rated',
 'released',
 'runtime',
 'title',
 'tomatoes',
 'type',
 'writers',
 'year'}

In [221]:
print('Jumlah keys yang ada pada movies collection: ', len(keys_movies))

Jumlah keys yang ada pada movies collection:  22


In [223]:
print('Jumlah keys yang ada pada clean_movies collection: ',len(col.find_one().keys()))

Jumlah keys yang ada pada clean_movies collection:  22


        Dapat diketahui dari hasil diatas bahwa ternyata jumlah keys yang ada pada movies collection dan clean_movies_bunga
        collection memiliki jumlah keys yang sama yaitu 22.

Untuk mengetahui apakah terdapat *keys* yang berbeda pada movies *collection* dan clean_movies_bunga *collection* mari kita cek dengan mengelompokkan *keys* dari kedua *collection* dan me-*looping*-nya dengan seleksi kondisi apabila terdapat *keys* di clean_movies_bunga *collection* yang tidak ada di movies *collection* maka *keys* yang berbeda tersebut akan ditampilkan.

In [226]:
clean_movies_keys = list(col.find_one().keys())
movies_keys = list(keys_movies)

In [227]:
for key in clean_movies_keys :
  if key not in movies_keys:
    print(key)

    Dapat diketahui bahwa ternyata TIDAK terdapat *keys* yang berbeda dari kedua *collection*. Hal ini dibuktikan karena 
    tidak ada *keys* yang ditampilkan dari code diatas.

## 5.5 Validate each values from movies *collection* dan clean_movies_bunga *collection*

In [251]:
list(dbmovies['movies'].find({'title': 'Civilization'}))

[{'_id': ObjectId('573a1390f29313caabcd5a93'),
  'awards': {'nominations': 0, 'text': '1 win.', 'wins': 1},
  'cast': ['Howard C. Hickman', 'Enid Markey', 'Lola May', 'Kate Bruce'],
  'countries': ['USA'],
  'directors': ['Reginald Barker',
   'Thomas H. Ince',
   'Raymond B. West',
   'Walter Edwards',
   'David Hartford',
   'Jay Hunt',
   'J. Parker Read Jr.'],
  'fullplot': 'Allegorical film about peace. A king starts a war, many of the women are against it, people are pressed into service. A count has constructed a submarine and gets the order to sink an ocean liner, that is also carrying - supposedly - ammunition for the enemy. The count refuses to fire the torpedos, and sinks the submarine. He survives, but in a limbo between death and life where he meets Jesus, who takes him over to preach peace. Naturally the king arrests him and sentences him to death for treason, but then Jesus shows him the real face of war.',
  'genres': ['Drama'],
  'imdb': {'id': 6517, 'rating': 6.3, 'vo

In [252]:
list(col.find({'title': 'Civilization'}))

[{'_id': ObjectId('5daffb1b986c4adedb754b7d'),
  'awards': {'nominations': None, 'text': '1 win.', 'wins': '1'},
  'cast': ['Howard C. Hickman', 'Enid Markey', 'Lola May', 'Kate Bruce'],
  'countries': ['USA'],
  'directors': ['Reginald Barker',
   'Thomas H. Ince',
   'Raymond B. West',
   'Walter Edwards',
   'David Hartford',
   'Jay Hunt',
   'J. Parker Read Jr.'],
  'fullPlot': 'Allegorical film about peace. A king starts a war, many of the women are against it, people are pressed into service. A count has constructed a submarine and gets the order to sink an ocean liner, that is also carrying - supposedly - ammunition for the enemy. The count refuses to fire the torpedos, and sinks the submarine. He survives, but in a limbo between death and life where he meets Jesus, who takes him over to preach peace. Naturally the king arrests him and sentences him to death for treason, but then Jesus shows him the real face of war.',
  'genres': ['Drama'],
  'imdb': {'id': 6517, 'rating': 6.3

    Saya mengambil sample data dengan title Civilization untuk memvalidasi dokumen tersebut. Dapat diketahui bahwa nilai
    masing-masing keys dari kedua collection memiliki NILAI YANG SAMA dan URUTAN YANG SAMA, akan tetapi pada
    clean_movies_bunga ada beberapa keys yang tidak memiliki nilai, hal ini disebabkan karena tidak ada keys tersebut 
    pada movies collection sehingga hanya terdapat keysnya tetapi tidak ada nilainya.

<a id='no6'></a>
# 6. Conclusion
Pada pratice case ini saya melakukan cleansing data dari movies_initial collection pada database sample_mflix agar memiliki dokumen, nilai, keys, dan urutan yang sama dengan movies collection. Akan tetapi karena data yang ada pada movies collection sebagian tidak ada di movies_initial maka dari itu hasilnya tidak bisa benar-benar sama.