## **Tugas 2: Preprocessing dan TF-IDF**

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
import pandas as pd

df = pd.read_csv("/content/drive/My Drive/PPW/tugas2/data_berita.csv")
df.head()

Unnamed: 0,judul,isi,tanggal,kategori
0,"Soft Tenis PON 2024 Dimulai, Keras Berebut Emas",Banda Aceh - Cabor Soft Tennis PON 2024 dimula...,"Rabu, 11 Sep 2024 23:15 WIB",Olahraga
1,220 Atlet Anggar Perebutkan Medali PON 2024,Jakarta - Cabang olahraga anggar pada Pekan Ol...,"Rabu, 11 Sep 2024 22:15 WIB",Olahraga
2,NPC: Ada Peran Menpora di Balik Sukses Paralim...,Tangerang - National Paralympic Committee (NPC...,"Rabu, 11 Sep 2024 21:15 WIB",Olahraga
3,Hasil Hong Kong Open 2024: Chico Terdepak di B...,Hong Kong - Chico Aura Dwi Wardoyo mesti langs...,"Rabu, 11 Sep 2024 20:11 WIB",Olahraga
4,Hong Kong Open 2024: Gregoria Melaju ke Babak ...,Hong Kong - Gregoria Mariska Tunjung melaju ke...,"Rabu, 11 Sep 2024 19:15 WIB",Olahraga


### ***Cleansing***

Cleansing adalah proses pengolahan data yang bertujuan untuk menghilangkan noise, error, atau data yang tidak relevan dari data yang telah dikumpulkan. Proses cleansing ini dilakukan untuk meningkatkan kualitas data dan memudahkan analisis dan pengolahan data.

Cleansing dapat dilakukan dengan cara mengidentifikasi dan menghapus data yang tidak relevan, seperti:

1. Data yang tidak sesuai dengan kriteria penelitian
2. Data yang terdiri dari noise, seperti tanda baca atau karakter yang tidak sesuai
3. Data yang memiliki error, seperti typo atau kesalahan dalam penginputan
4. Data yang tidak dapat diolah, seperti data yang tidak dapat diinterpretasikan

Cleansing dapat dilakukan dengan cara menggunakan algoritma-algoritma tertentu, seperti:

1. Algoritma filtering: Algoritma ini digunakan untuk menghilangkan data yang tidak relevan dengan cara mengidentifikasi dan menghapus data yang tidak sesuai dengan kriteria penelitian.
2. Algoritma cleaning: Algoritma ini digunakan untuk menghilangkan noise dan error dari data dengan cara mengidentifikasi dan menghapus data yang tidak sesuai dengan kriteria penelitian.
3. Algoritma normalization: Algoritma ini digunakan untuk menghilangkan data yang tidak sesuai dengan kriteria penelitian dengan cara mengnormalisasi data menjadi bentuk yang sama.

Cleansing memiliki beberapa tujuan, seperti:

1. Meningkatkan kualitas data: Cleansing dapat meningkatkan kualitas data dengan cara menghilangkan noise, error, dan data yang tidak relevan.
2. Memudahkan analisis: Cleansing dapat memudahkan analisis dengan cara menghilangkan data yang tidak relevan dan mengnormalisasi data menjadi bentuk yang sama.
3. Meningkatkan efisiensi: Cleansing dapat meningkatkan efisiensi dalam pengolahan data dengan cara menghilangkan data yang tidak relevan dan mengnormalisasi data menjadi bentuk yang sama.

Namun, cleansing juga memiliki beberapa kelemahan, seperti:

1. Kesulitan dalam mengidentifikasi data yang tidak relevan: Cleansing dapat sulit dalam mengidentifikasi data yang tidak relevan, sehingga dapat menghasilkan kesalahan dalam analisis.
2. Kesulitan dalam mengatasi noise: Cleansing dapat sulit dalam mengatasi noise, seperti tanda baca yang tidak sesuai dengan data yang akan diolah.
3. Kesulitan dalam mengatasi error: Cleansing dapat sulit dalam mengatasi error, seperti typo atau kesalahan dalam penginputan.

Dalam keseluruhan, cleansing adalah proses yang sangat berguna dalam pengolahan data, dan dapat digunakan untuk berbagai tujuan, seperti analisis sintaks, analisis semantik, dan lain-lain.

In [3]:
import re
import string
import nltk

# Fungsi ini bertujuan untuk menghapus URL dari teks.
def remove_url(ulasan):
  url = re.compile(r'https?://\S+|www\.S+')
  return url.sub(r'', ulasan)

# Fungsi ini bertujuan untuk menghapus tag HTML dari teks.
def remove_html(ulasan):
  html = re.compile(r'<.#?>')
  return html.sub(r'', ulasan)

# Fungsi ini bertujuan untuk menghapus emoji dari teks.
def remove_emoji(ulasan):
  emoji_pattern = re.compile("["
      u"\U0001F600-\U0001F64F"
      u"\U0001F300-\U0001F5FF"
      u"\U0001F680-\U0001F6FF"
      u"\U0001F1E0-\U0001F1FF""]+", flags=re.UNICODE)
  return emoji_pattern.sub(r'', ulasan)

# Fungsi ini bertujuan untuk menghapus angka dari teks.
def remove_numbers(ulasan):
  ulasan = re.sub(r'\d+', '', ulasan)
  return ulasan


# Fungsi ini bertujuan untuk menghapus simbol dari teks, menyisakan hanya huruf, angka, dan spasi.
def remove_symbols(ulasan):
  ulasan = re.sub(r'[^a-zA-Z0-9\s]', '', ulasan)
  return ulasan

df['cleansing'] = df['isi'].apply(lambda x: remove_url(x))
df['cleansing'] = df['cleansing'].apply(lambda x: remove_html(x))
df['cleansing'] = df['cleansing'].apply(lambda x: remove_emoji(x))
df['cleansing'] = df['cleansing'].apply(lambda x: remove_symbols(x))
df['cleansing'] = df['cleansing'].apply(lambda x: remove_numbers(x))

df.head(5)

Unnamed: 0,judul,isi,tanggal,kategori,cleansing
0,"Soft Tenis PON 2024 Dimulai, Keras Berebut Emas",Banda Aceh - Cabor Soft Tennis PON 2024 dimula...,"Rabu, 11 Sep 2024 23:15 WIB",Olahraga,Banda Aceh Cabor Soft Tennis PON dimulai Per...
1,220 Atlet Anggar Perebutkan Medali PON 2024,Jakarta - Cabang olahraga anggar pada Pekan Ol...,"Rabu, 11 Sep 2024 22:15 WIB",Olahraga,Jakarta Cabang olahraga anggar pada Pekan Ola...
2,NPC: Ada Peran Menpora di Balik Sukses Paralim...,Tangerang - National Paralympic Committee (NPC...,"Rabu, 11 Sep 2024 21:15 WIB",Olahraga,Tangerang National Paralympic Committee NPC I...
3,Hasil Hong Kong Open 2024: Chico Terdepak di B...,Hong Kong - Chico Aura Dwi Wardoyo mesti langs...,"Rabu, 11 Sep 2024 20:11 WIB",Olahraga,Hong Kong Chico Aura Dwi Wardoyo mesti langsu...
4,Hong Kong Open 2024: Gregoria Melaju ke Babak ...,Hong Kong - Gregoria Mariska Tunjung melaju ke...,"Rabu, 11 Sep 2024 19:15 WIB",Olahraga,Hong Kong Gregoria Mariska Tunjung melaju ke ...


### ***Case Folding***

Case folding adalah proses pengkonversian teks menjadi bentuk yang sama, baik huruf besar atau huruf kecil, untuk memudahkan analisis dan pengolahan teks. Case folding dilakukan dengan cara mengkonversi semua huruf besar menjadi huruf kecil atau sebaliknya.

Contoh:

* "Hello" menjadi "hello"
* "HELLO" menjadi "hello"
* "HeLlO" menjadi "hello"

Case folding memiliki beberapa tujuan, seperti:

1. Memudahkan analisis teks: Case folding memudahkan analisis teks dengan cara mengkonversi semua huruf besar menjadi huruf kecil, sehingga dapat diolah dengan lebih mudah.
2. Meningkatkan efisiensi: Case folding dapat meningkatkan efisiensi dalam pengolahan teks dengan cara mengurangi ukuran data yang perlu diolah.
3. Meningkatkan akurasi: Case folding dapat meningkatkan akurasi dalam analisis teks dengan cara mengkonversi semua huruf besar menjadi huruf kecil, sehingga dapat diolah dengan lebih akurat.

Case folding dapat dilakukan dengan cara menggunakan algoritma-algoritma tertentu, seperti:

1. Algoritma simple: Algoritma ini mengkonversi semua huruf besar menjadi huruf kecil dengan cara mengganti semua huruf besar dengan huruf kecil.
2. Algoritma complex: Algoritma ini mengkonversi semua huruf besar menjadi huruf kecil dengan cara mengganti semua huruf besar dengan huruf kecil, dan juga mengkonversi semua huruf kecil menjadi huruf besar.

Case folding memiliki beberapa kelebihan, seperti:

1. Memudahkan analisis teks: Case folding memudahkan analisis teks dengan cara mengkonversi semua huruf besar menjadi huruf kecil.
2. Meningkatkan efisiensi: Case folding dapat meningkatkan efisiensi dalam pengolahan teks dengan cara mengurangi ukuran data yang perlu diolah.
3. Meningkatkan akurasi: Case folding dapat meningkatkan akurasi dalam analisis teks dengan cara mengkonversi semua huruf besar menjadi huruf kecil.

Namun, case folding juga memiliki beberapa kelemahan, seperti:

1. Kesulitan dalam mengidentifikasi huruf besar dan huruf kecil: Case folding dapat sulit dalam mengidentifikasi huruf besar dan huruf kecil, sehingga dapat menghasilkan kesalahan dalam analisis teks.
2. Kesulitan dalam mengatasi noise: Case folding dapat sulit dalam mengatasi noise, seperti tanda baca yang tidak sesuai dengan huruf besar dan huruf kecil.

Dalam keseluruhan, case folding adalah proses yang sangat berguna dalam pengolahan teks, dan dapat digunakan untuk berbagai tujuan, seperti analisis sintaks, analisis semantik, dan lain-lain.

In [4]:
def case_folding(text):
    if isinstance(text, str):
      lowercase_text = text.lower()
      return lowercase_text
    else :
      return text

df ['case_folding'] = df['cleansing'].apply(case_folding)

df.head(5)

Unnamed: 0,judul,isi,tanggal,kategori,cleansing,case_folding
0,"Soft Tenis PON 2024 Dimulai, Keras Berebut Emas",Banda Aceh - Cabor Soft Tennis PON 2024 dimula...,"Rabu, 11 Sep 2024 23:15 WIB",Olahraga,Banda Aceh Cabor Soft Tennis PON dimulai Per...,banda aceh cabor soft tennis pon dimulai per...
1,220 Atlet Anggar Perebutkan Medali PON 2024,Jakarta - Cabang olahraga anggar pada Pekan Ol...,"Rabu, 11 Sep 2024 22:15 WIB",Olahraga,Jakarta Cabang olahraga anggar pada Pekan Ola...,jakarta cabang olahraga anggar pada pekan ola...
2,NPC: Ada Peran Menpora di Balik Sukses Paralim...,Tangerang - National Paralympic Committee (NPC...,"Rabu, 11 Sep 2024 21:15 WIB",Olahraga,Tangerang National Paralympic Committee NPC I...,tangerang national paralympic committee npc i...
3,Hasil Hong Kong Open 2024: Chico Terdepak di B...,Hong Kong - Chico Aura Dwi Wardoyo mesti langs...,"Rabu, 11 Sep 2024 20:11 WIB",Olahraga,Hong Kong Chico Aura Dwi Wardoyo mesti langsu...,hong kong chico aura dwi wardoyo mesti langsu...
4,Hong Kong Open 2024: Gregoria Melaju ke Babak ...,Hong Kong - Gregoria Mariska Tunjung melaju ke...,"Rabu, 11 Sep 2024 19:15 WIB",Olahraga,Hong Kong Gregoria Mariska Tunjung melaju ke ...,hong kong gregoria mariska tunjung melaju ke ...


### ***Tokenization***

Tokenization adalah proses pengkonversian teks menjadi unit-unit kecil yang disebut token. Token dapat berupa kata, frasa, atau karakter individu. Tujuan dari tokenization adalah untuk memudahkan analisis dan pengolahan teks, seperti analisis sintaks, analisis semantik, dan lain-lain.

Tokenization dilakukan dengan cara mengidentifikasi unit-unit kecil dalam teks, seperti:

1. Kata-kata: Tokenization dapat dilakukan dengan cara mengidentifikasi kata-kata individu dalam teks, seperti "hello", "world", dan lain-lain.
2. Frasa-frasa: Tokenization dapat dilakukan dengan cara mengidentifikasi frasa-frasa dalam teks, seperti "hello world", "this is a test", dan lain-lain.
3. Karakter-karakter: Tokenization dapat dilakukan dengan cara mengidentifikasi karakter-karakter individu dalam teks, seperti "a", "b", "c", dan lain-lain.

Tokenization dapat dilakukan dengan cara menggunakan algoritma-algoritma tertentu, seperti:

1. Algoritma whitespace: Algoritma ini menggunakan spasi sebagai batas antara token-token.
2. Algoritma punctuation: Algoritma ini menggunakan tanda baca sebagai batas antara token-token.
3. Algoritma regex: Algoritma ini menggunakan regular expression untuk mengidentifikasi token-token.

Tokenization memiliki beberapa kelebihan, seperti:

1. Memudahkan analisis teks: Tokenization memudahkan analisis teks dengan cara mengkonversikan teks menjadi unit-unit kecil yang lebih mudah diolah.
2. Meningkatkan efisiensi: Tokenization dapat meningkatkan efisiensi dalam pengolahan teks dengan cara mengurangi ukuran data yang perlu diolah.
3. Meningkatkan akurasi: Tokenization dapat meningkatkan akurasi dalam analisis teks dengan cara mengkonversikan teks menjadi unit-unit kecil yang lebih mudah diolah.

Namun, tokenization juga memiliki beberapa kelemahan, seperti:

1. Kesulitan dalam mengidentifikasi token-token: Tokenization dapat sulit dalam mengidentifikasi token-token yang tidak jelas, seperti kata-kata yang terdiri dari lebih dari satu kata.
2. Kesulitan dalam mengatasi noise: Tokenization dapat sulit dalam mengatasi noise, seperti tanda baca yang tidak sesuai dengan token-token.

Dalam keseluruhan, tokenization adalah proses yang sangat berguna dalam pengolahan teks, dan dapat digunakan untuk berbagai tujuan, seperti analisis sintaks, analisis semantik, dan lain-lain.

In [5]:
def tokenize(text):
    tokens = text.split()
    return tokens

df['tokenize'] = df['case_folding'].apply(tokenize)

df.head(5)

Unnamed: 0,judul,isi,tanggal,kategori,cleansing,case_folding,tokenize
0,"Soft Tenis PON 2024 Dimulai, Keras Berebut Emas",Banda Aceh - Cabor Soft Tennis PON 2024 dimula...,"Rabu, 11 Sep 2024 23:15 WIB",Olahraga,Banda Aceh Cabor Soft Tennis PON dimulai Per...,banda aceh cabor soft tennis pon dimulai per...,"[banda, aceh, cabor, soft, tennis, pon, dimula..."
1,220 Atlet Anggar Perebutkan Medali PON 2024,Jakarta - Cabang olahraga anggar pada Pekan Ol...,"Rabu, 11 Sep 2024 22:15 WIB",Olahraga,Jakarta Cabang olahraga anggar pada Pekan Ola...,jakarta cabang olahraga anggar pada pekan ola...,"[jakarta, cabang, olahraga, anggar, pada, peka..."
2,NPC: Ada Peran Menpora di Balik Sukses Paralim...,Tangerang - National Paralympic Committee (NPC...,"Rabu, 11 Sep 2024 21:15 WIB",Olahraga,Tangerang National Paralympic Committee NPC I...,tangerang national paralympic committee npc i...,"[tangerang, national, paralympic, committee, n..."
3,Hasil Hong Kong Open 2024: Chico Terdepak di B...,Hong Kong - Chico Aura Dwi Wardoyo mesti langs...,"Rabu, 11 Sep 2024 20:11 WIB",Olahraga,Hong Kong Chico Aura Dwi Wardoyo mesti langsu...,hong kong chico aura dwi wardoyo mesti langsu...,"[hong, kong, chico, aura, dwi, wardoyo, mesti,..."
4,Hong Kong Open 2024: Gregoria Melaju ke Babak ...,Hong Kong - Gregoria Mariska Tunjung melaju ke...,"Rabu, 11 Sep 2024 19:15 WIB",Olahraga,Hong Kong Gregoria Mariska Tunjung melaju ke ...,hong kong gregoria mariska tunjung melaju ke ...,"[hong, kong, gregoria, mariska, tunjung, melaj..."


### ***Stopword Removal***

Stopword removal adalah proses penghapusan kata-kata yang tidak berarti atau tidak penting dalam teks, seperti kata-kata yang berfungsi sebagai konjungsi, preposisi, atau kata-kata yang tidak memiliki arti yang jelas. Kata-kata ini disebut stopwords.

Stopwords dapat mengganggu analisis teks, karena mereka dapat membuat teks menjadi tidak jelas atau sulit dipahami. Oleh karena itu, stopwords harus dihapus dari teks sebelum melakukan analisis.

Contoh stopwords:

* Konjungsi: and, but, or, yet
* Preposisi: of, in, on, at
* Kata-kata yang tidak memiliki arti: a, an, the, is, are, am
* Kata-kata yang berfungsi sebagai konjungsi: however, therefore, thus

Stopword removal dapat dilakukan dengan cara menggunakan algoritma-algoritma tertentu, seperti:

1. Algoritma list-based: Algoritma ini menggunakan daftar stopwords yang telah ditentukan sebelumnya untuk menghapus stopwords dari teks.
2. Algoritma machine learning: Algoritma ini menggunakan machine learning untuk mengidentifikasi stopwords dan menghapus mereka dari teks.
3. Algoritma natural language processing: Algoritma ini menggunakan teknologi natural language processing untuk mengidentifikasi stopwords dan menghapus mereka dari teks.

Stopword removal memiliki beberapa tujuan, seperti:

1. Meningkatkan kualitas analisis: Stopword removal dapat meningkatkan kualitas analisis teks dengan cara menghilangkan kata-kata yang tidak berarti atau tidak penting.
2. Meningkatkan efisiensi: Stopword removal dapat meningkatkan efisiensi dalam pengolahan teks dengan cara menghilangkan kata-kata yang tidak berarti atau tidak penting.
3. Meningkatkan akurasi: Stopword removal dapat meningkatkan akurasi dalam analisis teks dengan cara menghilangkan kata-kata yang tidak berarti atau tidak penting.

Namun, stopword removal juga memiliki beberapa kelemahan, seperti:

1. Kesulitan dalam mengidentifikasi stopwords: Stopword removal dapat sulit dalam mengidentifikasi stopwords, sehingga dapat menghasilkan kesalahan dalam analisis.
2. Kesulitan dalam mengatasi kata-kata yang memiliki arti yang jelas: Stopword removal dapat sulit dalam mengatasi kata-kata yang memiliki arti yang jelas, sehingga dapat menghasilkan kesalahan dalam analisis.

Dalam keseluruhan, stopword removal adalah proses yang sangat berguna dalam pengolahan teks, dan dapat digunakan untuk berbagai tujuan, seperti analisis sintaks, analisis semantik, dan lain-lain.

In [6]:
from nltk.corpus import stopwords
nltk.download('stopwords')
stop_words = stopwords.words('indonesian')

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Unzipping corpora/stopwords.zip.


In [7]:
def remove_stopwords(text):
  return [word for word in text if word not in stop_words]

df['stopword_removal'] = df['tokenize'].apply(lambda x: ' '.join(remove_stopwords(x)))

df.head(5)

Unnamed: 0,judul,isi,tanggal,kategori,cleansing,case_folding,tokenize,stopword_removal
0,"Soft Tenis PON 2024 Dimulai, Keras Berebut Emas",Banda Aceh - Cabor Soft Tennis PON 2024 dimula...,"Rabu, 11 Sep 2024 23:15 WIB",Olahraga,Banda Aceh Cabor Soft Tennis PON dimulai Per...,banda aceh cabor soft tennis pon dimulai per...,"[banda, aceh, cabor, soft, tennis, pon, dimula...",banda aceh cabor soft tennis pon persaingan ke...
1,220 Atlet Anggar Perebutkan Medali PON 2024,Jakarta - Cabang olahraga anggar pada Pekan Ol...,"Rabu, 11 Sep 2024 22:15 WIB",Olahraga,Jakarta Cabang olahraga anggar pada Pekan Ola...,jakarta cabang olahraga anggar pada pekan ola...,"[jakarta, cabang, olahraga, anggar, pada, peka...",jakarta cabang olahraga anggar pekan olahraga ...
2,NPC: Ada Peran Menpora di Balik Sukses Paralim...,Tangerang - National Paralympic Committee (NPC...,"Rabu, 11 Sep 2024 21:15 WIB",Olahraga,Tangerang National Paralympic Committee NPC I...,tangerang national paralympic committee npc i...,"[tangerang, national, paralympic, committee, n...",tangerang national paralympic committee npc in...
3,Hasil Hong Kong Open 2024: Chico Terdepak di B...,Hong Kong - Chico Aura Dwi Wardoyo mesti langs...,"Rabu, 11 Sep 2024 20:11 WIB",Olahraga,Hong Kong Chico Aura Dwi Wardoyo mesti langsu...,hong kong chico aura dwi wardoyo mesti langsu...,"[hong, kong, chico, aura, dwi, wardoyo, mesti,...",hong kong chico aura dwi wardoyo mesti langsun...
4,Hong Kong Open 2024: Gregoria Melaju ke Babak ...,Hong Kong - Gregoria Mariska Tunjung melaju ke...,"Rabu, 11 Sep 2024 19:15 WIB",Olahraga,Hong Kong Gregoria Mariska Tunjung melaju ke ...,hong kong gregoria mariska tunjung melaju ke ...,"[hong, kong, gregoria, mariska, tunjung, melaj...",hong kong gregoria mariska tunjung melaju baba...


In [8]:
df.to_csv("/content/drive/My Drive/PPW/tugas2/hasil_prepros.csv",encoding='utf8', index=False)

### ***TF-IDF (Term Frequency-Inverse Document Frequency)***

TF-IDF (Term Frequency-Inverse Document Frequency) adalah suatu metode yang digunakan untuk menghitung pentingnya suatu kata dalam suatu dokumen. Metode ini menghitung frekuensi kata dalam suatu dokumen (Term Frequency) dan juga menghitung frekuensi kata dalam semua dokumen lainnya (Inverse Document Frequency). Dengan demikian, TF-IDF dapat digunakan untuk menghitung pentingnya suatu kata dalam suatu dokumen dan juga untuk menghitung relevansi suatu kata dengan suatu topik.

In [9]:
import pandas as pd

data = pd.read_csv("/content/drive/My Drive/PPW/tugas2/hasil_prepros.csv", sep=",")

In [10]:
from sklearn.feature_extraction.text import TfidfVectorizer

# Menginisialisasi TfidfVectorizer
vectorizer = TfidfVectorizer()

# Menghitung TF-IDF
tfidf_matrix = vectorizer.fit_transform(df['stopword_removal'])

In [11]:
# Mengubah hasilnya menjadi DataFrame
tfidf_df = pd.DataFrame(tfidf_matrix.toarray(), columns=vectorizer.get_feature_names_out())
tfidf_df.head(10)

Unnamed: 0,abubakar,aceh,acehsumut,acehsumutini,advertisement,agus,air,ajang,alifa,allif,...,wide,widjaja,widodo,with,xin,xxi,ya,yuhsuanpada,zheng,zulfikar
0,0.0,0.203678,0.0,0.0,0.048628,0.0,0.0,0.0,0.054772,0.054772,...,0.0,0.0,0.0,0.024314,0.0,0.0,0.0,0.0,0.0,0.0
1,0.033963,0.202075,0.203778,0.033963,0.030153,0.067926,0.0,0.086615,0.0,0.0,...,0.0,0.0,0.0,0.015077,0.0,0.101889,0.028872,0.0,0.0,0.033963
2,0.0,0.085223,0.0,0.0,0.050867,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.025434,0.0,0.0,0.0,0.0,0.0,0.0
3,0.0,0.0,0.0,0.0,0.039616,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.019808,0.0,0.0,0.0,0.0,0.0,0.0
4,0.0,0.0,0.0,0.0,0.056435,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.028218,0.0,0.0,0.0,0.063566,0.0,0.0
5,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
6,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.179681,0.0,0.0,0.0,0.0,0.0,0.0,0.0
7,0.0,0.0,0.0,0.0,0.049265,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.024633,0.0,0.0,0.0,0.0,0.0,0.0
8,0.0,0.0,0.0,0.0,0.046933,0.0,0.0,0.0,0.0,0.0,...,0.0,0.105727,0.0,0.023467,0.052863,0.0,0.044939,0.0,0.052863,0.0
9,0.0,0.0,0.0,0.0,0.046355,0.0,0.052212,0.044385,0.0,0.0,...,0.052212,0.0,0.0,0.023177,0.0,0.0,0.0,0.0,0.0,0.0
