In [21]:
import pandas as pd

# 데이터 파일 읽기
file_path = 'tomato.csv'  # 파일 경로 설정 (파일이 같은 디렉토리에 있어야 함)

# 데이터 파일 읽기
data = pd.read_csv(file_path)

# 파일의 첫 몇 행을 출력하여 데이터 구조 확인
print(data.head())

# 초기값 설정
B0 = 8.0  # 초기 당도
A0 = 3.5  # 초기 산도
F0 = 3.5  # 초기 경도
R0 = 10.0  # 초기 당/산 비율
V0 = 50.0  # 초기 비타민 C

# 당도 (Brix) 계산
data['당도 (Brix)'] = (
    B0 +
    0.015 * data['건구 온도'] +       # 건구 온도 (온도) 영향
    0.005 * data['이산화탄소']     # CO₂ 영향
)

# 산도 (Acidity) 계산 (더 낮은 초기값과 수정된 계수)
data['산도 (Acidity)'] = (
    3.0 - 0.003 * data['건구 온도'] +      # 건구 온도가 높을수록 산도 감소
    0.002 * data['상대 습도'] +             # 습도가 높을수록 산도 증가
    0.002 * data['이산화탄소']              # 이산화탄소 농도가 높을수록 산도 증가
)

# 경도 (Firmness) 계산
data['경도 (Firmness)'] = (
    F0 -
    0.005 * data['건구 온도'] -       # 건구 온도 영향
    0.003 * data['상대 습도']    # 습도 영향
)

# 비타민 C 계산
data['비타민 C'] = (
    V0 +
    0.008 * data['이산화탄소']     # CO₂ 영향
)

# 각 컬럼의 평균값 계산
average_brix = data['당도 (Brix)'].mean()
average_acidity = data['산도 (Acidity)'].mean()
average_firmness = data['경도 (Firmness)'].mean()
average_vitamin_c = data['비타민 C'].mean()

# 결과 출력
print(data)
print(f"평균 당도 (Brix): {average_brix:.2f}")
print(f"평균 산도 (Acidity): {average_acidity:.2f}")
print(f"평균 경도 (Firmness): {average_firmness:.2f}")
print(f"평균 비타민 C: {average_vitamin_c:.2f}")

# 총 평균값 계산 (모든 계산된 값들의 평균)
total_average = (average_brix + average_acidity + average_firmness + average_vitamin_c) / 4
print(f"총 평균값: {total_average:.2f}")




                수집일자  건구 온도  습구 온도   근권  상대 습도  절대 습도  이슬점  수분 부족  이산화탄소
0  1/9/2021 00:03:00    8.2    6.3  7.3   76.3    6.4  4.3    2.0   1037
1  1/9/2021 00:08:00    8.2    6.5  7.3   77.9    6.6  4.6    1.9   1040
2  1/9/2021 00:13:00    8.1    6.5  7.3   78.6    6.6  4.6    1.8   1041
3  1/9/2021 00:18:00    8.1    6.6  7.4   80.9    6.8  5.1    1.6   1038
4  1/9/2021 00:23:00    8.1    6.7  7.4   81.7    6.9  5.2    1.5   1035
                      수집일자  건구 온도  습구 온도    근권  상대 습도  절대 습도   이슬점  수분 부족  \
0        1/9/2021 00:03:00    8.2    6.3   7.3   76.3    6.4   4.3    2.0   
1        1/9/2021 00:08:00    8.2    6.5   7.3   77.9    6.6   4.6    1.9   
2        1/9/2021 00:13:00    8.1    6.5   7.3   78.6    6.6   4.6    1.8   
3        1/9/2021 00:18:00    8.1    6.6   7.4   80.9    6.8   5.1    1.6   
4        1/9/2021 00:23:00    8.1    6.7   7.4   81.7    6.9   5.2    1.5   
...                    ...    ...    ...   ...    ...    ...   ...    ...   
11651  16/11/2021 14:37

In [13]:

# 데이터 파일 읽기
file_path = 'tomato.csv'  # 파일 경로 설정 (파일이 같은 디렉토리에 있어야 함)

# 데이터 파일 읽기
data = pd.read_csv(file_path)


In [3]:
import pandas as pd
import numpy as np

# 데이터 파일 읽기
file_path = 'tomato.csv'  # 파일 경로 설정 (파일이 같은 디렉토리에 있어야 함)
data = pd.read_csv(file_path)

# '수집일자'에서 시간만 추출 (형식을 맞춰줌)
data['시간'] = pd.to_datetime(data['수집일자'], format='%d/%m/%Y %H:%M:%S').dt.hour

# 간단한 일사량 추정 모델 (기온과 시간대에 따른 일사량)
data['일사량 (W/m^2)'] = (
    100 * data['건구 온도'] * np.log1p(data['시간'])  # 기온과 시간에 비례하여 증가
)

# 새로운 CSV 파일로 저장
output_file_path = 'tomato_with_solar_radiation.csv'  # 저장할 새로운 파일 경로
data.to_csv(output_file_path, index=False)

# 결과 출력
print(f"새로운 CSV 파일이 '{output_file_path}'로 저장되었습니다.")
print(data[['수집일자', '건구 온도', '시간', '일사량 (W/m^2)']].head())


새로운 CSV 파일이 'tomato_with_solar_radiation.csv'로 저장되었습니다.
                수집일자  건구 온도  시간  일사량 (W/m^2)
0  1/9/2021 00:03:00    8.2   0          0.0
1  1/9/2021 00:08:00    8.2   0          0.0
2  1/9/2021 00:13:00    8.1   0          0.0
3  1/9/2021 00:18:00    8.1   0          0.0
4  1/9/2021 00:23:00    8.1   0          0.0
