# Avsluttende programmerings prosjekt ProgMod
## Problemstillingen
* Hvordan kan vi bruke programmering til å modellere og simulere kunstig intelligens? 
* Hvilke faktorer påvirker læring, beslutningstaking og etikk? 
* Hvilke begrensninger har modellene dine, og drøft hva de forteller oss om kunstig intelligens

## Introduksjon til kunstig inteligens
Oxford ordboken definerer kunstig intelligens som “utviklingen av datasystemer i stand til å utføre oppgaver som normalt krever menneskelig intelligens, for eksempel visuell persepsjon, talegjenkjenning, beslutningstaking og oversettelse mellom språk”. Men flere av disse vanlige algoritmene og programmene klarer også å utføre disse oppgavene. Så hva er det som skiller kunstig intelligens fra vanlige datasystemer? Den store forskjellen mellom kunstig intelligens og vanlige programmer er at i vanlig programmering må vi finne mønstrene selv og programmere et system som bruker mønsteret. Med kunstig intelligens skjer utviklingen på en grunnleggende annen måte. Istedenfor å fortelle programmet nøyaktig hva det skal gjøre, gir vi det et datasett, og programmet finner mønstre selv. Ofte kan dette være mer effektivt enn den “gamle måten”, men det kan også ha ulemper, for eksempel ved å finne mønstre som ikke er relevante. Det kan også være partisk hvis datasettet ikke er representativt, og mønstrene AIen finner er derfor ikke representative. Et eksempel på dette er Amazons AI som hjalp dem med ansettelse. Den var partisk fordi den var basert på tidligere CV-er de hadde mottatt som da var mannsdominerte. Programmet anbefalte derfor menn oftere enn kvinner.<sup>[1]</sup> Kunstig intelligens er ikke en perfekt løsning på alt, og man må være klar over hvordan man bruker det på en ansvarlig måte. Men det betyr ikke at det ikke kan være nyttig hvis man forstår begrensningene og bygger rundt dem.



## Bruk av kunstig inteligens
Det er enkelt å komme i gang med å bruke KI i dag. Et eksempel er Tensoflow. TensorFlow er et populært rammeverk for maskinlæring og dyp læring som kan brukes til å bygge og trene modeller for ulike formål. For eksempel kan du bruke TensorFlow til å bygge en modell som kan klassifisere bilder av hunder og katter. TensorFlow har også mange ressurser og dokumentasjon tilgjengelig på nettet som kan hjelpe deg med å komme i gang. Under kan du se et eksempel som bruker Tensoflow på et enkelt datasett.

In [7]:
import tensorflow as tf
from tensorflow import keras
import pandas as pd
from sklearn.model_selection import train_test_split

# Load the dataset
data = pd.read_csv('https://raw.githubusercontent.com/EliasT05/vaerdata/main/vaerdata13-22.csv')


data = data.astype('float32')



# Split the data into training and test sets
train_data, test_data = train_test_split(data, test_size=0.2)

# Define the features and labels
features = train_data.drop('mean(air_temperature P1D)', axis=1)
labels = train_data['mean(air_temperature P1D)']

# Build the model
model = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=[len(features.keys())]),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(1)
])

# Compile the model
model.compile(optimizer='adam', loss='mean_squared_error', metrics=['accuracy'])

# Train the model
history = model.fit(features, labels, epochs=10)

# Evaluate the model on the test data
test_features = test_data.drop('mean(air_temperature P1D)', axis=1)
test_labels = test_data['mean(air_temperature P1D)']
test_loss, test_acc = model.evaluate(test_features, test_labels)

print(f'Test accuracy: {test_acc}')

ValueError: could not convert string to float: '2013-04-01'

In [16]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

# Load the iris dataset
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Split the data into training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Create a decision tree classifier
clf = DecisionTreeClassifier()

# Train the classifier on the training data
clf.fit(X_train, y_train)

# Make predictions on the test data
y_pred = clf.predict(X_test)

# Calculate the accuracy of the model
accuracy = clf.score(X_test, y_test)
print(f'Accuracy: {accuracy}')


Accuracy: 0.9333333333333333


In [None]:
import tensorflow as tf
import pandas as pd
import numpy as np
from keras import layers
import datetime
import time

df = pd.read_csv("https://raw.githubusercontent.com/EliasT05/vaerdata/main/vaerdata13-22.csv")
df.drop("index", inplace=True, axis=1)
def convert_to_unix(df, column):
  ref_time = []
  #df[column] = pd.to_datetime(df[column])
  for index, row in df.iterrows():
    ref_time.append(time.mktime(datetime.datetime.strptime(row["referenceTime"], "%Y-%m-%d").timetuple()))
  df["referenceTime"] = ref_time
  return df
  
df = convert_to_unix(df, "referenceTime")
print(df)
#print(df.head())

df_features = df.copy()
df_labels = df_features.pop('referenceTime')
df_features = np.array(df)
df_features

normalize = layers.Normalization()
normalize.adapt(df_features)

norm_vaer_model = tf.keras.Sequential([
  normalize,
  layers.Dense(64),
  layers.Dense(1)
])

norm_vaer_model.compile(loss = tf.keras.losses.MeanSquaredError(),
                           optimizer = tf.keras.optimizers.Adam())

norm_vaer_model.fit(df_features, df_labels, epochs=10)

'''
vaer_model = tf.keras.Sequential([
  layers.Dense(64),
  layers.Dense(1)
])

vaer_model.compile(loss = tf.keras.losses.MeanSquaredError(),
                      optimizer = tf.keras.optimizers.Adam())

vaer_model.fit(df_features, df_labels, epochs=10)

'''
'''
#(x_train, y_train),(x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test, y_test)
'''

In [None]:
import tensorflow as tf
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Load the data from the CSV file
data = pd.read_csv('https://raw.githubusercontent.com/EliasT05/vaerdata/main/vaerdata13-22.csv', parse_dates=['referenceTime'])
df.drop('index', inplace=True, axis=1)
#data['sum(duration_of_sunshine P1D)'] = data['sum(duration_of_sunshine P1D)'].replace({'nan': '0'}, regex=True)
data.fillna(0, inplace=True)
print(data)
# Convert the referenceTime column to a numerical value
data['referenceTime'] = data['referenceTime'].apply(lambda x: x.timestamp())

# Create a StandardScaler object
scaler = StandardScaler()

# Fit the scaler on the data
scaler.fit(data)

# Transform the data using the fitted scaler
data_normalized = scaler.transform(data)

# Convert the normalized data back to a DataFrame
data = pd.DataFrame(data_normalized, columns=data.columns)



#------------------------------------


# Split the data into features and labels
#df_features = df.copy()
#df_labels = df_features.pop('referenceTime')

X = data[["referenceTime"]]
y = data[['mean(air_temperature P1D)',"mean(air_temperature P1D)", "mean(cloud_area_fraction P1D)"]]

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y)

# Create a TensorFlow model
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=[X.shape[1]]),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(3)
])

# Compile the model
model.compile(loss='mean_squared_error', optimizer='adam')

# Train the model
model.fit(X_train, y_train, epochs=10)

# Evaluate the model on the test set
loss = model.evaluate(X_test, y_test)

KeyError: "['index'] not found in axis"

In [None]:
import pandas as pd

# Load the new data
#new_data = pd.read_csv("https://raw.githubusercontent.com/EliasT05/vaerdata/main/vaerdata13-22.csv", parse_dates=['referenceTime'])
new_data = pd.DataFrame({
    'referenceTime': ['2023-01-01']})
#new_data.drop("index", inplace=True, axis=1)
#new_data = "2023-01-01"

# Convert the referenceTime column to a numerical value
new_data['referenceTime'] = (pd.to_datetime(data['referenceTime']).apply(lambda x: x.timestamp()))
print(type(new_data))

# Make predictions using the trained model
predictions = model.predict(new_data)

print(scaler.inverse_transform(pd.DataFrame({'mean(air_temperature P1D)':predictions[:, 0]})))
print(predictions[:, 1])
print(predictions[:, 2])

#print(data)
# Add the predictions to the new data
#new_data = predictions
#print((new_data))
#print(scaler.inverse_transform(new_data))

<class 'pandas.core.frame.DataFrame'>


ValueError: non-broadcastable output operand with shape (1,1) doesn't match the broadcast shape (1,5)

## Kunstig inteligens i dag
Kunstig intelligens (KI) har blitt stadig mer utbredt i dagens samfunn og har mange bruksområder, inkludert chat-modeller. Chat-modeller er en type KI som brukes til å simulere en samtale mellom mennesker og maskiner. Disse modellene kan brukes til å automatisere kundeservice og gi raskere svar på spørsmål fra kunder.

Det er imidlertid også bekymringer knyttet til bruken av KI i chat-modeller og andre applikasjoner. For eksempel kan KI-systemer være sårbare for angrep og manipulasjon, og det kan være vanskelig å avgjøre om en samtale skjer mellom et menneske eller en maskin. Det er også bekymringer knyttet til personvern og sikkerhet når det gjelder innsamling og bruk av data i KI-systemer.

Når det gjelder ChatGPT, er dette en modell som ble utviklet av OpenAI for å simulere samtaler mellom mennesker og maskiner. Microsoft integrerte denne modellen i Bing for å gi brukerne bedre søkemotorer og anbefalingssystemer. Selv om ChatGPT har gjort det mulig for den gjennomsnittlige forbrukeren å bruke AI i det daglige livet sitt, har det også vært noen utfordringer med modellen. For eksempel var GPT-3-modellen som ChatGPT var basert på, trent på eldre data og var optimalisert for samtaleflyt og ikke nøyaktighet. Dette førte til at modellen slet med matematikk og fant opp fakta. Microsoft integrerte senere OpenAI sin GPT-3-modell i Bing for å gi brukerne bedre søkemotorer og anbefalingssystemer.


En bekymring som har kommet frem etter at chat-modeller ble populære er at forbrukere kan ha urealistiske forventninger til hva KI kan gjøre. For eksempel kan noen forbrukere tro at KI-systemer kan løse alle problemer eller gi nøyaktige svar på alle spørsmål. Dette kan føre til at forbrukere tar beslutninger basert på feilaktig informasjon eller at de blir skuffet når KI-systemer ikke fungerer som forventet. Chat-modeller er er ofte veldig selvsikre selv når de har feil, noe som kan føre til at forburkere bil villedet.

## Fotnoter
<sup id=“fn1”>[1]</sup> The Guardian

<span id="fn2"> footnote 1</span>