In [1]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd
import pyarrow as pa
import pyarrow.parquet as pq

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(24, 30):
        tanggal = f"2023-04-{i:02d}"
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 24-30 April 2023")
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_april_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 24-30 April 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.000         12.000              0         0,00%
                         - Beras Medium         kg        10.500         10.500              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        12.833         12.833              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter             -              -              -             -
     

In [2]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2023-05-{i:02d}"  
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 1-31 Mei 2023") 
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_mei_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 1-31 Mei 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.000         12.000              0         0,00%
                         - Beras Medium         kg        10.500         10.500              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        12.833         12.833              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter             -              -              -             -
      - 

In [3]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 30): 
        tanggal = f"2023-06-{i:02d}"  
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 1-30 Juni 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_juni_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 1-30 Juni 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.500         12.500              0         0,00%
                         - Beras Medium         kg        10.500         10.500              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        13.000         13.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.667         14.667              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
      -

In [4]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2023-07-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Juli 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_juli_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Juli 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.500         12.500              0         0,00%
                         - Beras Medium         kg        10.150         10.150              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        13.000         13.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.667         14.667              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
      

In [5]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2023-08-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Agustus 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_agustus_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Agustus 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.500         12.667            167         1,33%
                         - Beras Medium         kg        10.500         10.667            167         1,59%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        13.000         13.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.667         14.500           -167        -1,14%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
   

In [6]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 30):  
        tanggal = f"2023-09-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 September 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_september_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 September 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        12.500         12.500              0         0,00%
                         - Beras Medium         kg         9.800         10.633            833         8,50%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        13.167         13.167              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
 

In [7]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2023-10-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Oktober 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_oktober_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Oktober 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        13.500         13.500              0         0,00%
                         - Beras Medium         kg        11.400         11.400              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        14.000         14.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
   

ReadTimeout: HTTPSConnectionPool(host='siskaperbapo.jatimprov.go.id', port=443): Read timed out. (read timeout=None)

In [14]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 30):  
        tanggal = f"2023-11-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 November 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_november_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 November 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        14.000         14.000              0         0,00%
                         - Beras Medium         kg        11.300         11.300              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        15.000         15.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.167         14.167              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.500         19.500              0         0,00%
  

In [9]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2023-12-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Desember 2023")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_desember_2023.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Desember 2023
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        13.833         13.833              0         0,00%
                         - Beras Medium         kg        11.400         11.400              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        16.000         16.000              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.167         14.167              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
  

In [10]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 31):  
        tanggal = f"2024-1-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Januari 2024")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_januari_2024.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-31 Januari 2024
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        13.667         13.667              0         0,00%
                         - Beras Medium         kg        11.400         11.400              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        16.167         16.167              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
   

In [11]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 29):  
        tanggal = f"2024-2-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-29 Februari 2024")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_februari_2024.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-29 Februari 2024
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        13.667         13.667              0         0,00%
                         - Beras Medium         kg        11.400         11.400              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        16.167         16.167              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        14.333         14.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
  

In [12]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 30):  
        tanggal = f"2024-3-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 Maret 2024")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_maret_2024.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-30 Maret 2024
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        16.000         16.000              0         0,00%
                         - Beras Medium         kg        12.300         12.300              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        16.067         16.067              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        15.500         15.500              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.000         19.000              0         0,00%
     

In [13]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd

def fetch_table_data(url, payload):
    response = requests.post(url, data=payload)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        table = soup.find('table')
        if table:
            rows = table.find_all('tr')
            data = []
            for row in rows[1:]:
                cols = row.find_all('td')
                if len(cols) >= 7:  
                    no = cols[0].text.strip()
                    nama = cols[1].text.strip()
                    satuan = cols[2].text.strip()
                    harga_kemarin = cols[3].text.strip()
                    harga_sekarang = cols[4].text.strip()
                    perubahan_rp = cols[5].text.strip()
                    perubahan_persen = cols[6].text.strip()
                    data.append([no, nama, satuan, harga_kemarin, harga_sekarang, perubahan_rp, perubahan_persen])
            return data
        else:
            print("Tabel tidak ditemukan")
    else:
        print("Gagal mengambil data dari endpoint")
    return []

def main():
    headers = ["NO", "NAMA BAHAN POKOK", "SATUAN", "HARGA KEMARIN", "HARGA SEKARANG", "PERUBAHAN (Rp)", "PERUBAHAN (%)"]
    all_data = []
    for i in range(1, 24):  
        tanggal = f"2024-4-{i:02d}" 
        payload = {
            'tanggal': tanggal,
            'kabkota': 'jombangkab',
            'pasar': ''
        }

        endpoint_url = "https://siskaperbapo.jatimprov.go.id/harga/tabel.nodesign/"
        data = fetch_table_data(endpoint_url, payload)
        if data:
            print(f"Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-24 April 2024")  
            print("Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso")
            df = pd.DataFrame(data, columns=headers)
            print(df.to_string(index=False))
            print()  
            all_data.append(df)  
        else:
            print(f"Tidak ada data yang ditemukan untuk tanggal {tanggal}")
            print()

    final_df = pd.concat(all_data, ignore_index=True)
    print("Gabungan Data untuk Semua Tanggal:")
    print(final_df)

    output_file = 'jombang_april_2024.parquet'
    table = pa.Table.from_pandas(final_df)
    pq.write_table(table, output_file)

if __name__ == "__main__":
    main()


Harga Rata-Rata Kabupaten Jombang di Tingkat Konsumen Tanggal 01-24 April 2024
Pasar : Pasar Pon, Pasar Cukir, Pasar Ploso
NO                     NAMA BAHAN POKOK     SATUAN HARGA KEMARIN HARGA SEKARANG PERUBAHAN (Rp) PERUBAHAN (%)
                        - Beras Premium         kg        15.333         15.333              0         0,00%
                         - Beras Medium         kg        12.833         12.833              0         0,00%
02                                 GULA                                                                     
                   - Gula Kristal Putih         kg        16.600         16.600              0         0,00%
03                        MINYAK GORENG                                                                     
                  - Minyak Goreng Curah         kg        17.333         17.333              0         0,00%
        - Minyak Goreng Kemasan Premium    1 liter        19.500         19.500              0         0,00%
     