# About Dataset

Selamat datang diFastFood calories data, yang memberikan rincian komprehensif tentang kandungan yang ada didalam berbagai produk makanan cepat saji dari rantai makanan cepat saji populer. Makanan cepat saji terkenal karena kenyamanan dan harganya yang terjangkau, namun juga terkenal karena kandungan kalorinya yang tinggi, lemaknya yang tinggi, dan kandungan gulanya yang tinggi. Kumpulan data ini bertujuan untuk menjelaskan nilai gizi produk makanan cepat saji, membantu konsumen membuat keputusan yang lebih tepat mengenai pilihan makanan mereka. Dengan informasi tentang kalori, lemak, karbohidrat, protein, dan nutrisi penting lainnya, kumpulan data ini memberikan sumber daya berharga bagi ahli gizi, peneliti, dan individu yang sadar kesehatan.

Sumber: https://www.kaggle.com/datasets/sujaykapadnis/fast-food-calories-data Data from fastfoodnutrition.com



# Import Libraries/Setup

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

1. `import pandas as pd`: Kode ini mengimpor pustaka Pandas dengan alias 'pd'. Pandas adalah pustaka Python yang digunakan untuk manipulasi dan analisis data tabular.

2. `import matplotlib.pyplot as plt`: Kode ini mengimpor modul pyplot dari pustaka Matplotlib. Matplotlib adalah pustaka yang kuat untuk membuat visualisasi data dalam berbagai bentuk, seperti plot garis, histogram, scatter plot, dan lain-lain.

3. `import seaborn as sns`: Kode ini mengimpor pustaka Seaborn dengan alias 'sns'. Seaborn adalah pustaka yang dibangun di atas Matplotlib dan menyediakan antarmuka yang lebih tinggi untuk membuat plot yang lebih menarik dan informatif, terutama untuk plot statistik.

# Specify the filepath


Untuk menentukan jalur file dalam berbagai bahasa pemrograman, Anda dapat menggunakan sintaks yang sesuai dengan bahasa yang Anda gunakan. Di bawah ini adalah contoh cara menentukan jalur file dalam beberapa bahasa pemrograman yang umum digunakan:

In [None]:
file_path = "/path/to/your/file.txt"


Pastikan untuk mengganti "/path/to/your/file.txt" dengan jalur sebenarnya ke file yang Anda tuju. Dalam beberapa kasus, Anda mungkin juga perlu menggunakan karakter escape untuk karakter seperti backslash ("") dalam jalur file, tergantung pada bahasa pemrograman yang Anda gunakan.






# Load the data

Memuat data dengan Python adalah tugas mendasar ketika bekerja dengan berbagai jenis sumber data. Kita dapat menggunakan berbagai cara untuk memuat data ke Python:

**Manual Fuction**

Manual fuction mendesain fungsi khusus untuk memuat data dari jenis file tertentu (misalnya CSV). File CSV (Comma Separated Values) sebenarnya adalah file teks, tapi memiliki struktur untuk mengatur datanya. Seperti namanya, struktur yang digunakan CSV adalah koma. Koma digunakan untuk memisah data.

Contoh menggunakan file CSV:

In [None]:
def load_csv(filepath):
    data = []
    with open(filepath) as f:
        for line in f:
            data.append(line.strip().split(','))
    return data


**Numpy's loadtxt function**

Numpy menyediakan fungsi bawaan yang disebut **loadtxt** untuk memuat data dari file teks (misalnya, CSV, dibatasi tab). Numpy adalah fungsi yang sangat sederhana untuk memuat data. Ini sangat berguna untuk membaca data yang memiliki tipe data yang sama. Selain itu, sangat berguna untuk membaca data yang memiliki tipe data yang sama. Ketika data lebih kompleks, sulit untuk dibaca menggunakan fungsi ini, namun ketika file mudah dan sederhana, fungsi ini sangat berguna.

In [None]:
import numpy as np
dataset = np.loadtxt('data.csv', delimiter=',')

**Pandas' read_csv()**

Pandas adalah perpustakaan manipulasi data yang sangat populer, dan sangat umum digunakan karena kemudahan penggunaannya. alah satu fungsinya yang sangat penting dan matang adalah **read_csv()** yang dapat membaca file .csv

In [None]:
import pandas as pd
df = pd.read_csv('data.csv')

Contoh menggunakan Pandas

1. Menampilkan beberapa baris teratas

Metode `.head()` akan menampilkan lima baris pertama dari dataframe. Jika ingin menampilkan jumlah baris yang berbeda, dapat menambahkan argumen ke dalam metode tersebut, misalnya `df.head(10)` untuk menampilkan sepuluh baris pertama.

In [1]:
import pandas as pd

# Read the CSV file
df = pd.read_csv('/content/fastfood_calories.csv')

# Display the first few rows of the dataframe
print(df.head())

   Unnamed: 0 restaurant                                       item  calories  \
0           1  Mcdonalds           Artisan Grilled Chicken Sandwich       380   
1           2  Mcdonalds             Single Bacon Smokehouse Burger       840   
2           3  Mcdonalds             Double Bacon Smokehouse Burger      1130   
3           4  Mcdonalds  Grilled Bacon Smokehouse Chicken Sandwich       750   
4           5  Mcdonalds   Crispy Bacon Smokehouse Chicken Sandwich       920   

   cal_fat  total_fat  sat_fat  trans_fat  cholesterol  sodium  total_carb  \
0       60          7      2.0        0.0           95    1110          44   
1      410         45     17.0        1.5          130    1580          62   
2      600         67     27.0        3.0          220    1920          63   
3      280         31     10.0        0.5          155    1940          62   
4      410         45     12.0        0.5          120    1980          81   

   fiber  sugar  protein  vit_a  vit_c  calc

2. Menampilkan beberapa baris terbawah

Metode `.tail()` akan menampilkan lima baris terbawah dari dataframe. Jika Anda ingin menampilkan jumlah baris yang berbeda, Anda dapat menambahkan argumen ke dalam metode tersebut, misalnya `df.tail(5)` untuk menampilkan sepuluh baris terbawah.

In [2]:
import pandas as pd

# Read your CSV file into a dataframe (replace 'your_file.csv' with the actual file path)
df = pd.read_csv('/content/fastfood_calories.csv')

# Display the last 5 rows
print(df.tail(5))

     Unnamed: 0 restaurant                            item  calories  cal_fat  \
510         511  Taco Bell  Spicy Triple Double Crunchwrap       780      340   
511         512  Taco Bell     Express Taco Salad w/ Chips       580      260   
512         513  Taco Bell          Fiesta Taco Salad-Beef       780      380   
513         514  Taco Bell       Fiesta Taco Salad-Chicken       720      320   
514         515  Taco Bell         Fiesta Taco Salad-Steak       720      320   

     total_fat  sat_fat  trans_fat  cholesterol  sodium  total_carb  fiber  \
510         38     10.0        0.5           50    1850          87    9.0   
511         29      9.0        1.0           60    1270          59    8.0   
512         42     10.0        1.0           60    1340          74   11.0   
513         35      7.0        0.0           70    1260          70    8.0   
514         36      8.0        1.0           55    1340          70    8.0   

     sugar  protein  vit_a  vit_c  calcium  

3. Menampilkan informasi dataframe

`info():` Metode ini memberikan informasi detail tentang dataframe, termasuk jumlah baris data, nama-nama kolom beserta jumlah data dan tipe datanya.

In [3]:
# Display information about the dataframe
print(df.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 515 entries, 0 to 514
Data columns (total 18 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   Unnamed: 0   515 non-null    int64  
 1   restaurant   515 non-null    object 
 2   item         515 non-null    object 
 3   calories     515 non-null    int64  
 4   cal_fat      515 non-null    int64  
 5   total_fat    515 non-null    int64  
 6   sat_fat      515 non-null    float64
 7   trans_fat    515 non-null    float64
 8   cholesterol  515 non-null    int64  
 9   sodium       515 non-null    int64  
 10  total_carb   515 non-null    int64  
 11  fiber        503 non-null    float64
 12  sugar        515 non-null    int64  
 13  protein      514 non-null    float64
 14  vit_a        301 non-null    float64
 15  vit_c        305 non-null    float64
 16  calcium      305 non-null    float64
 17  salad        515 non-null    object 
dtypes: float64(7), int64(8), object(3)
memory usage: 7

4. Menampilkan deskripsi statistik

`describe():` Metode ini menampilkan deskriptif statistik data, seperti rata-rata, standar deviasi, nilai minimum, dan maksimum. Hanya kolom yang bertipe numerik yang akan ditampilkan statistiknya.

In [4]:
# Displays descriptive statistical data
print(df.describe())

       Unnamed: 0     calories      cal_fat   total_fat     sat_fat  \
count  515.000000   515.000000   515.000000  515.000000  515.000000   
mean   258.000000   530.912621   238.813592   26.590291    8.153398   
std    148.811962   282.436147   166.407510   18.411876    6.418811   
min      1.000000    20.000000     0.000000    0.000000    0.000000   
25%    129.500000   330.000000   120.000000   14.000000    4.000000   
50%    258.000000   490.000000   210.000000   23.000000    7.000000   
75%    386.500000   690.000000   310.000000   35.000000   11.000000   
max    515.000000  2430.000000  1270.000000  141.000000   47.000000   

        trans_fat  cholesterol       sodium  total_carb       fiber  \
count  515.000000   515.000000   515.000000  515.000000  503.000000   
mean     0.465049    72.456311  1246.737864   45.664078    4.137177   
std      0.839644    63.160406   689.954278   24.883342    3.037460   
min      0.000000     0.000000    15.000000    0.000000    0.000000   
25%  

# Visualize the data