# Wprowadzenie do dużych modeli językowych z GPT i LangChain

[ChatGPT](https://chat.openai.com/) cieszy się ogromną popularnością, z ponad miliardem odwiedzin miesięcznie. Chociaż interfejs internetowy jest świetny dla wielu przypadków użycia czasami (dla zadań programistycznych i automatyzacji), lepiej jest uzyskać dostęp do GPT za pośrednictwem API OpenAI.

Nauczymy się także korzystać z biblioteki LangChain, narzędzia ułatwiajacego pracę z API OpenAI.

Omówimy następujace zagadnienia:

- Zakładanie konta developerskiego w OpenAI.
- Wywoływanie funkcji Chatu w API OpenAI z użyciem LangChain i bez.
- Podstawy Prompt Engineeringu.
- Podtrzymywanie konwersacji z GPT.
- Pomysły na wykorzystanie GPT we wsparciu pracy developerskiej.

Będziemy używac GPT do analizy [zbioru danych](https://catalog.data.gov/dataset/electric-vehicle-population-data) dotyczącego samochodów elektrycznych w stanie Waszyngton, USA. 

## Zanim zaczniemy

Należy utworzyc konto developerskie w OpenAI.

## Zadanie 1: Konfiguracja

Potrzebujemy zainstalowac bibliotekę `langchain`. Biblioteka jest szybko aktualizowana, zmiany pojawiaja się często, dlatego korzystamy z określonej wersji.

Biblioteka `langchain` zależy od innej paczki, `typing_extensions`, dlatego w tym przypadku również potrzebujemy określonego numeru wersji.

### Instrukcje

Uruchamiamy poniższy kod, aby zainstalować `langchain`,  `openai==0.28` i `typing_extensions`.

In [None]:
# Install the langchain and openai packages
!pip install langchain==0.0.300
!pip install openai==0.28

Collecting langchain==0.0.300
  Downloading langchain-0.0.300-py3-none-any.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m90.0 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting SQLAlchemy<3,>=1.4
  Downloading SQLAlchemy-2.0.30-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.1/3.1 MB[0m [31m116.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting dataclasses-json<0.7,>=0.5.7
  Downloading dataclasses_json-0.6.7-py3-none-any.whl (28 kB)
Collecting jsonpatch<2.0,>=1.33
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting tenacity<9.0.0,>=8.1.0
  Downloading tenacity-8.3.0-py3-none-any.whl (25 kB)
Collecting PyYAML>=5.3
  Downloading PyYAML-6.0.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (736 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m736.6/736.6 KB[0m [31m81.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting

In [None]:
# Update the typing_extensions package
!pip install typing_extensions==4.8.0

Collecting typing_extensions==4.8.0
  Downloading typing_extensions-4.8.0-py3-none-any.whl (31 kB)
Installing collected packages: typing_extensions
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
thinc 8.1.5 requires pydantic!=1.8,!=1.8.1,<1.11.0,>=1.7.4, but you have pydantic 2.7.4 which is incompatible.
sqlalchemy-redshift 0.8.11 requires SQLAlchemy<2.0.0,>=0.9.2, but you have sqlalchemy 2.0.30 which is incompatible.
sqlalchemy-bigquery 1.6.1 requires sqlalchemy<2.0.0dev,>=1.2.0, but you have sqlalchemy 2.0.30 which is incompatible.
spacy 3.4.2 requires pydantic!=1.8,!=1.8.1,<1.11.0,>=1.7.4, but you have pydantic 2.7.4 which is incompatible.
snowflake-sqlalchemy 1.4.3 requires sqlalchemy<2.0.0,>=1.4.0, but you have sqlalchemy 2.0.30 which is incompatible.
snowflake-connector-python 2.8.0 requires cryptography<37.0.0,>=3.1.0, but you have cryptography 38.

Aby móc pracować z biblioteka `openai` i `os` musimy je wczytać, a następnie ustanowić zmienna srodowiskowa potrzebna do przechowywania klucza API.

### Instrukcje

- Importujemy paczke `os`.
- Importujemy paczkę `openai`.
- Ustawiamy `openai.api_key` na zmienna srodowiskowa `OPENAI_API_KEY`.

In [None]:
# Import the os package

# Import the openai package

# Set openai.api_key to the OPENAI_API_KEY environment variable


Musimy zaimportować pakiet `langchain`. Posiada on wiele podmodułów, więc aby zaoszczędzić później czas na pisaniu, zaimportujemy również niektóre konkretne funkcje z tych podmodułów.

### Instrukcje

- Importujemy paczkę `langchain` jako `lc`.
- Z modułu `langchain.chat_models` importujemy `ChatOpenAI`.
- Z modułu `langchain.schema` importujemy `AIMessage`, `HumanMessage`, `SystemMessage`.

In [None]:
# Import the langchain package as lc

# From the langchain.chat_models module, import ChatOpenAI

# From the langchain.schema module, import AIMessage, HumanMessage, SystemMessage


Będziemy również potrzebować wykonać nieco manipulacji danych za pomocą pakietu `pandas` oraz wizualizacji danych z użyciem `plotly.express`. Pakiet `IPython.display` zawiera natomiast funkcje umożliwiające czytelne wyświetlanie treści Markdown.

Importujemy następujace paczki:

- `pandas` używajac aliasu `pd`.
- `plotly.express` używajac aliasu `px`.
- Z`IPython.display` importujemy `display` i `Markdown`.

In [None]:
# Import pandas using the alias pd

# Import plotly.express using the alias px

# From the IPython.display package, import display and Markdown


## Zadanie 1: Import danych o samochodach elektrycznych

Dane o samochodach elektrycznych znajdują się w pliku CSV o nazwie `electric_cars.csv`.

Każdy wiersz w zbiorze danych reprezentuje liczbę zarejestrowanych samochodów w danym mieście, dla konkretnego modelu.

Zbiór danych zawiera następujące kolumny:

- `city` (character): Miasto, w którym znajduje się właściciel samochodu.
- `county` (character): Hrabstwo, w którym mieszka właściciel.
- `model_year` (integer): Rok produkcji samochodu.
- `make` (character): Producent samochodu.
- `model` (character): Model samochodu.
- `electric_vehicle_type` (character): Typ - "Plug-in Hybrid Electric Vehicle (PHEV)" albo "Battery Electric Vehicle (BEV)".
- `n_cars` (integer): Liczba zarejestrowanych pojazdów.

Naszym pierwszym krokiem jest zaimportowanie i wyświetlenie danych.

### Instrukcje

Importujemy dane o samochodach elektycznych do pandas dataframe.

- Wczytujemy dane z pliku `electric_cars.csv`, przypisujac do zmiennej `electric_cars`.
- Wyswietlamy opis kolumn numerycznych dla `electric_cars`.
- Wyswietlamy opis kolumn tekstowych dla `electric_cars`.
- Wyswietlamy caly zbior danych.

In [None]:
# Read the data from electric_cars.csv. Assign to electric_cars.
electric_cars = pd.read_csv("electric_cars.csv")

# Display a description of the numeric columns
print("Description of numeric columns\n")

# Display a description of the text (object) columns
print("Description of text columns\n")

# Print the whole dataset
print("The electric cars dataset\n")


Description of numeric columns



Unnamed: 0,model_year,n_cars
count,26813.0,26813.0
mean,2019.375527,5.612166
std,3.286257,26.997325
min,1997.0,1.0
25%,2017.0,1.0
50%,2020.0,2.0
75%,2022.0,4.0
max,2024.0,1514.0


Description of text columns



Unnamed: 0,city,county,make,model,electric_vehicle_type
count,26813,26813,26813,26813,26813
unique,683,183,37,127,2
top,Bothell,King,TESLA,LEAF,Battery Electric Vehicle (BEV)
freq,479,7066,5071,1889,15885


The electric cars dataset



Unnamed: 0,city,county,model_year,make,model,electric_vehicle_type,n_cars
0,Seattle,King,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),1514
1,Seattle,King,2018,TESLA,MODEL 3,Battery Electric Vehicle (BEV),1153
2,Seattle,King,2021,TESLA,MODEL Y,Battery Electric Vehicle (BEV),1147
3,Seattle,King,2022,TESLA,MODEL Y,Battery Electric Vehicle (BEV),1122
4,Bellevue,King,2023,TESLA,MODEL Y,Battery Electric Vehicle (BEV),931
...,...,...,...,...,...,...,...
26808,Lakewood,Pierce,2022,BMW,IX,Battery Electric Vehicle (BEV),1
26809,Lakewood,Pierce,2022,BMW,X5,Plug-in Hybrid Electric Vehicle (PHEV),1
26810,Lakewood,Pierce,2022,FORD,TRANSIT,Battery Electric Vehicle (BEV),1
26811,Lakewood,Pierce,2022,HYUNDAI,KONA ELECTRIC,Battery Electric Vehicle (BEV),1


## Zadanie 2: Zadajemy pytanie do GPT

Zacznijmy od wysłania wiadomości do GPT i otrzymania odpowiedzi. Na razie nie będziemy martwić się o dołączanie szczegółów dotyczących zbioru danych.
Pominiemy również na razie używanie modułu LangChain, aby sprawdzić jak biblioteka `openai` działa samodzielnie.

### Typy wiadomości

Istnieja trzy rodzaje wiadomości opisane we [wprowadzeniu do OpenAI](https://platform.openai.com/docs/guides/chat/introduction), dokumentujace pracę z Chatem. Wykorzystamy dwa z dostępnych typów:

- wiadomości `system` opisują zachowanie asystenta AI.
- wiadomości `user` opisują, co chcemy, aby Chat umieścił w odpowiedzi na nasz prompt. Przykłady tego omówimy dzisiaj.

### Instrukcje

Wysyłamy pytanie do GPT i czekamy na odpowiedź.

- Definiujemy wiadomość typu 'system', przypisujac ja do zmiennej: `system_msg_test`.

```
"""You are a helpful assistant who understands data science.
 You write in a clear language that a ten year old can understand.
 You keep your answers brief.""". 
```
    
- Definiujemy wiadomość typu 'user', przypisujac ja do zmiennej: `user_msg_test`.

```
"Tell me some uses of GPT for data analysis."
```

- Tworzymy listę wiadomości, składajaca sie z wiadomości systemowych i użytkownika. Przypisujemy do `msgs_test`.
- Wysyłamy odpowiedź do GPT. Wynik przypisujemy do zmiennej: `rsps_test`.

In [None]:
# Define the system message. Assign to system_msg_test.

# Define the user message. Assign to user_msg_test.

# Create a message list from the system and user messages. Assign to msgs_test.

# Send the messages to GPT. Assign to rsps_test.


Musimy teraz przeanalizować odpowiedź. Wynik jest zagnieżdżonym obiektem, który oprócz odpowiedzi tekstowej, którą chcemy uzyskać zawiera wiele metadanych. Wyświetlamy całość, aby zobaczyć strukturę i wyekstrahować tylko treść tekstową.

### Instrukcje

Wyświetlamy cala odpowiedź oraz sama zawartosc tekstowa

In [None]:
# Print the whole response
print("The whole response\n")

print("\n\n----\n\n")

# Print just the response's content
print("Just the response's content\n")


The whole response

{
  "id": "chatcmpl-9ZJMDOfj9Z5n8QGffKaBnmYO5Odch",
  "object": "chat.completion",
  "created": 1718202917,
  "model": "gpt-4-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "1. Text Generation: GPT can be used to create story, essays, or even write code for you.\n2. Chatbots: It can be used for making chatbots more conversational and intelligent.\n3. Sentiment Analysis: GPT can help determine if a piece of text is positive, negative, or neutral.\n4. Content Filtering: It can identify inappropriate content or spam in text.\n5. Machine Translation: It can be used to translate text from one language to another."
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 52,
    "completion_tokens": 99,
    "total_tokens": 151
  },
  "system_fingerprint": null
}


----


Just the response's content

1. Text Generation: GPT can be used to create story, essay

## Zadanie 3: Zadawanie pytań dotyczacych naszego zbioru danych.

Teraz, gdy wiemy, że GPT działa, możemy zacząć zadawać pytania dotyczące analizy danych dla naszego zbioru. Ponieważ znamy szczegóły naszego zbioru danych, możemy włączyć je do naszego promptu, aby poprawić jakość otrzymywanych odpowiedzi.

Kolejną zmianą, którą wprowadzimy, jest użycie pakietu `langchain`, który zapewnia wygodną warstwę użytkowa dla pakietu `openai` .

### Dlaczego warto rozważyć korzystanie z LangChain?

Kod w poprzednim zadaniu wykorzystywał złożone obiekty zagnieżdżone w dwóch miejscach (lista słownikowa dla wiadomości oraz lista i słownik słownikowy dla odpowiedzi). Ten rodzaj obiektów jest typowy w tworzeniu aplikacji internetowych, ale nie w analizie danych, gdzie dane (ramki danych pandas i tabele SQL) są bardziej powszechne.

Jedną z zalet LangChain jest to, że upraszcza kod dla niektórych zadań, pozwalając uniknąć zamieszania związanego z nadmiarem nawiasów podczas nawigacji po tych głębokich obiektach.

Po drugie, jeśli chcemy zamienić GPT na inny model w przyszłości (co często ma miejsce w środowisku korporacyjnym), może być łatwiej, jeśli użyjemy pakietu `langchain` zamiast `openai`.

### Typy wiadomości w LangChain

Typy komunikatów LangChain nazywają się nieco inaczej niż typy komunikatów OpenAI:

- `SystemMessage` jest odpowiednikiem wiadomości `system` OpenAI.
- `HumanMessage` jest odpowiednikiem wiadomości `user` OpenAI.

### Instrukcje

Tworzymy prompt zawierający szczegóły naszego zestawu danych.

- _Opis dostarczonego zbioru danych._
- Tworzymy zadanie dla AI. Przypisujemy do: `suggest_questions`.
    - Używamy promptu: `"Suggest some data analysis questions that could be answered with this dataset."`.
- Łaczymy opis zbioru danych z requestem. Przypisujemy do: `msgs_suggest_questions`.
    - Pierwsza wiadomość to wiadomość systemowa o treści: `"You are a data analysis expert."`.
    - Druga to human message z `dataset_description` i `suggest_questions` połączonymi z dwoma przerwami między wierszami.

In [None]:
# A description of the dataset
dataset_description = """
You have a dataset about electric cars registered in Washington state, USA in 2020. It is available as a pandas DataFrame named `electric_cars`.

Each row in the dataset represents the count of the number of cars registered within a city, for a particular model.

The dataset contains the following columns.

- `city` (character): The city in which the registered owner resides.
- `county` (character): The county in which the registered owner resides.
- `model_year` (integer): The [model year](https://en.wikipedia.org/wiki/Model_year#United_States_and_Canada) of the car.
- `make` (character): The manufacturer of the car.
- `model` (character): The model of the car.
- `electric_vehicle_type` (character): Either "Plug-in Hybrid Electric Vehicle (PHEV)" or "Battery Electric Vehicle (BEV)".
- `n_cars` (integer): The count of the number of vehicles registered.
"""

# Create a task for the AI. Assign to suggest_questions.

# Concatenate the dataset description and the request. Assign to msgs_suggest_questions.


### Instrukcje

- Tworzymy obiekt `ChatOpenAI`. Przypisujemy do `chat`.
- Przekazujemy wiadomość do GPT. Przypisujemy do `rsps_suggest_questions`.
- Wyświetlamy obiekty odpowiedzi i jej zawartość.
- Wyświetlamy typ odpowiedzi

In [None]:
# Create a ChatOpenAI object. Assign to chat.

# Pass your message to GPT. Assign to rsps_suggest_questions.

# Print the response
print("The whole response\n")

print("\n----\n")

# Print just the response's content
print("Just the response's content\n")

print("\n----\n")

# Print the type of the response
print("The type of the response\n")


The whole response

content='Here are some data analysis questions that could be explored using the provided dataset on electric cars registered in Washington state in 2020:\n\n1. What is the distribution of electric vehicle types (PHEV vs. BEV) in Washington state in 2020?\n2. Which city in Washington state had the highest number of electric cars registered in 2020?\n3. What are the top 5 most popular electric car models registered in Washington state in 2020?\n4. Is there a correlation between the model year of electric cars and the number of cars registered in 2020?\n5. How does the distribution of electric cars vary across different counties in Washington state?\n6. Which electric car manufacturer (make) had the highest number of cars registered in Washington state in 2020?\n7. Are there any cities in which only one type of electric vehicle (PHEV or BEV) is predominantly registered?\n8. How does the average number of cars registered per city differ between PHEVs and BEVs?\n9. Is th

## Zadanie 4: Podtrzymujemy konwersacje z GPT

Zwróćmy uwage, że odpowiedź z GPT była obiektem podobnym do słownika. Najbardziej użyteczną częścią jest element `.content`, który zawiera tekstową odpowiedź na prompt.

Chociaż pojedynczy prompt i odpowiedź mogą być przydatne, często chcemy prowadzić dłuższą rozmowę z GPT. W takim przypadku można przekazać poprzednie wiadomości, aby GPT mogło „zapamiętać”, co zostało powiedziane wcześniej.

### AI messages

Odpowiedź od GPT miała typ `AIMessage`. Odróżniając `AIMessage` od `HumanMessage`, można stwierdzić, kto co powiedział w rozmowie z AI.

### Wyświetlanie zawartości Markdown

Gdy GPT generuje kod jako dane wyjściowe, jest on często formatowany jako blok kodu Markdown wewnątrz potrójnych nawiasów. Możemy wyświetlić Markdown przejrzyściej, zamieniając `print()` na funkcje `display()` i `Markdown()`.

```py
display(Markdown(your_markdown_text))
```

### Instrukcje

Dołączamy kolejny prompt do rozmowy i ponownie rozmawiamy z GPT.

- Dołączamy odpowiedź i nową wiadomość do poprzednich wiadomości. Przypisujemy do `msgs_python_top_models`.
- Przekazujemy wiadomość do GPT. Przypisujemy do `rsps_python_top_models`.
- Wyświetlamy zawartość odpowiedzi (Markdown).

"Write Python code to find the top make/model combinations of electric car in Washington state,"

In [None]:
# Append the response and a new message to the previous messages. 
# Assign to msgs_python_top_models.

# Pass your message to GPT. Assign to rsps_python_top_models.

# Display the response's Markdown content


You can find the top make/model combinations of electric cars in Washington state using the provided dataset by grouping the data by the 'make' and 'model' columns and then summing the 'n_cars' column to get the total count of each make/model combination. Finally, you can sort the results to find the top combinations. Here's the Python code to achieve this:

```python
# Grouping the data by 'make' and 'model' columns and summing the 'n_cars' column
top_make_model_combinations = electric_cars.groupby(['make', 'model'])['n_cars'].sum().reset_index()

# Sorting the data to find the top make/model combinations
top_make_model_combinations = top_make_model_combinations.sort_values(by='n_cars', ascending=False)

# Displaying the top make/model combinations
top_make_model_combinations.head()
```

This code snippet will give you the top make/model combinations of electric cars registered in Washington state based on the total count of each combination. You can adjust the number of top combinations displayed by changing the `head()` parameter.

## Zadanie 5: Wykonanie kodu zwróconego przez model GPT

Właśnie poprosiliśmy GPT o napisanie dla nas kodu. Sprawdźmy, czy zadziałał.

Jest to standardowy przepływ pracy w interakcji z generatywną sztuczną inteligencją: sztuczna inteligencja działa jako analityk danych, który pisze kod, a my działamy jako szef, który sprawdza jej pracę.

### Instrukcje

Przegladamy pracę naszego asystenta AI.

- Kopiujemy i wklejamy kod wygenerowany przez GPT do następnej komórki kodu i uruchamiamy go.
- Patrzymy na wynik. Czy jest poprawny?


In [None]:
# Paste the code generated by GPT and run it


Unnamed: 0,make,model,n_cars
108,TESLA,MODEL Y,28502
105,TESLA,MODEL 3,27708
91,NISSAN,LEAF,13186
106,TESLA,MODEL S,7611
30,CHEVROLET,BOLT EV,5733


## Zadanie 6: Kontynujemy konwersjację z GPT, proszac o pomoc w wizualizacji danych

Wykonywanie dalszych analiz z pomocą GPT to po prostu kontynuowanie rozmowy poprzez dodawanie nowych promptów `HumanMessage` do listy wiadomości i wywoływanie funkcji `chat()`.

Domyślnie dane wyjściowe z GPT są losowe, ale podczas analizy danych nie zawsze jest to pożądane, ponieważ chcemy, aby wyniki były powtarzalne. W przypadku dużych modeli językowych losowość może być kontrolowana za pomocą parametru znanego jako „temperatura”.

- `temperature` kontroluje losowość odpowiedzi. Waha się od `0` do `2`, gdzie zero oznacza minimalną losowość (aby ułatwić odtwarzanie wyników), a dwa oznacza maksymalną losowość (często daje niespodziewane odpowiedzi). Jeśli korzystamy bezpośrednio z API OpenAI, domyślną wartością jest `1`, ale użycie LangChain zmniejsza domyślną wartość do `0,7`. 

### Instrukcje

- Tworzymy nowy obiekt czatu OpenAI z temperaturą ustawioną na zero. Przypisujemy do `chat0`.

In [None]:
# Create a new OpenAI chat object with temperature set to zero. Assign to chat0.


### Instrukcje

- Ponownie przeprowadzamy poprzednią konwersację, dołączając poprzednią odpowiedź i nowe żądanie kodu w Python, aby narysować wykres słupkowy całkowitej liczby samochodów elektrycznych według roku modelowego, ze słupkami pokolorowanymi według typu pojazdu elektrycznego.
    - Rozwiązanie prosi o kod w Plotly Express, ale możemy wybrać dowolny preferowany pakiet Python do wizualizacji danych.

"Write some Python code to draw a bar plot of the total count of electric cars by model year, with bars colored by electric vehicle type. Use the plotly express package"

In [None]:
# Ask GPT for code for a bar plot, as detailed in the instructions


To create a bar plot of the total count of electric cars by model year, with bars colored by electric vehicle type using the Plotly Express package in Python, you can follow the code below:

```python
import plotly.express as px

# Grouping the data by 'model_year' and 'electric_vehicle_type' columns and summing the 'n_cars' column
total_count_by_year_type = electric_cars.groupby(['model_year', 'electric_vehicle_type'])['n_cars'].sum().reset_index()

# Creating the bar plot using Plotly Express
fig = px.bar(total_count_by_year_type, x='model_year', y='n_cars', color='electric_vehicle_type',
             labels={'model_year': 'Model Year', 'n_cars': 'Total Count of Electric Cars'},
             title='Total Count of Electric Cars by Model Year (Colored by Electric Vehicle Type)')

# Displaying the plot
fig.show()
```

This code snippet will generate a bar plot using Plotly Express, where each bar represents the total count of electric cars for a specific model year, and the bars are colored based on the electric vehicle type (PHEV or BEV). You can customize the plot further by adjusting the labels, title, and other plot properties as needed.

### Instrukcje

Aby sprawdzić, jak duża jest zmienność przy temperaturze ustawionej na zero, ponownie prosimy GPT o to samo.

- Ponownie wywołujemy GPT z tą samą listą komunikatów i wyświetlamy odpowiedź.
- Patrzymy na treść odpowiedzi. Jak bardzo jest ona zbliżona do poprzedniej odpowiedzi?

In [None]:
# Call GPT again with the same message list and display the response


To create a bar plot of the total count of electric cars by model year, with bars colored by electric vehicle type using the Plotly Express package in Python, you can follow the code below:

```python
import plotly.express as px

# Grouping the data by 'model_year' and 'electric_vehicle_type' columns and summing the 'n_cars' column
total_count_by_year_type = electric_cars.groupby(['model_year', 'electric_vehicle_type'])['n_cars'].sum().reset_index()

# Creating the bar plot using Plotly Express
fig = px.bar(total_count_by_year_type, x='model_year', y='n_cars', color='electric_vehicle_type',
             labels={'model_year': 'Model Year', 'n_cars': 'Total Count of Electric Cars'},
             title='Total Count of Electric Cars by Model Year (Colored by Electric Vehicle Type)')

# Displaying the plot
fig.show()
```

This code snippet will generate a bar plot using Plotly Express, where each bar represents the total count of electric cars for a specific model year, and the bars are colored based on the electric vehicle type (PHEV or BEV). You can customize the plot further by adjusting the labels, title, and other plot properties as needed.

## Zadanie 7: Wykonujemy kod dostarczony przez GPT, aby zobaczyć nasz wykres

Ustawienie temperatury na zero usunęło wszelką losowość, dzięki czemu dwukrotnie uzyskaliśmy ten sam wynik. Dzięki temu przepływ pracy jest bardziej powtarzalny.

Ostatnim zadaniem jest obejrzenie wykresu. Pamiętajmy, że GPT jest tylko asystentem, za każdym razem powinniśmy weryfikowac poprawnosc jego odpowiedzi.

### Instrukcje

Odpalamy kod i sprawdzamy, czy wykres jest prawidłowy.

- Uruchamiamy kod wykresu słupkowego wygenerowany przez GPT.
- Sprawdzamy, czy wynik jest poprawny.

In [None]:
# Paste the code generated by GPT and run it


## Podsumowanie

Zobaczyliśmy jak uzyskać dostęp do GPT za pośrednictwem interfejsu API OpenAI zarówno bezpośrednio, jak i przy użyciu LangChain.

Zobaczyliśmy, w jaki sposób GPT może być używane do wymyślania pomysłów na analizydanych i pisania kodu.

Zobaczyliśmy również, jak prowadzić rozszerzoną konwersację i jak kontrolować powtarzalność odpowiedzi.

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=fe9a2bfe-c021-4ce5-8682-9f508468869d' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>