# **Joins**

<img src="https://www.nilebits.com/wp-content/uploads/2020/10/Difference-between-Inner-and-Outer-Join-in-SQL.jpg">
<a href="https://www.nilebits.com/blog/2010/11/difference-between-inner-and-outer-join-in-sql/">img source</a>

### In an optimaized table, there should be no unnecessary duplicate data.

Exempel: Böcker och författare i olika tabeller -->

<div style="display: flex; flex-direction: row;">
  <div style="flex: 1; margin:10px;">

| Id | Titel | Utgivningsår | FörfattareID | Beskrivning |
|----|-------|--------------|-------------|-------------|
| 1  | The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition | 2009 | 1 | Maskininlärning och datamining med fokus på statistiska metoder. Boken är skriven för akademiker och forskare, men kan också vara till nytta för praktiker. |
| 2  | Deep Learning | 2016 | 2 | En introduktion till djupa neurala nätverk och dess tillämpningar inom maskininlärning. Författaren täcker grunderna i neurala nätverk och går sedan vidare till avancerade ämnen som rekurrenta neurala nätverk och förstärkningsinlärning. |
| 3  | Python for Data Analysis | 2012 | 3 | En praktisk guide till att använda Python för datavetenskapliga tillämpningar. Boken täcker grundläggande datamanipulationsfunktioner, dataanalyser och visualiseringstekniker med hjälp av pandas, numpy och matplotlib-biblioteken. |
| 4  | Machine Learning: A Probabilistic Perspective | 2012 | 1 | En introduktion till maskininlärning med fokus på probabilistiska modeller och bayesianska metoder. Författaren täcker allt från grunderna i sannolikhetsteori till avancerade maskininlärningstekniker som Bayesian Networks och Gaussian Processes. |
| 5  | Artificial Intelligence: A Modern Approach | 2002 | 2 | En introduktion till AI med fokus på symbolisk AI, probabilistiska metoder och maskininlärning. Boken täcker också avancerade ämnen som naturlig språkbehandling och robotik. |


  </div>
  <div style="flex: 1; margin:10px;">

| Id | Författare      | Födelsedatum | Beskrivning |
|----|----------------|--------------|-------------|
| 1  | Trevor Hastie  | 1953         | Trevor Hastie är en framstående statistiker och datavetare som har gjort betydande bidrag inom områdena statistisk inlärning, datamining och maskininlärning. |
| 2  | Stuart Russell | 1962         | Stuart Russell är en välkänd AI-forskare och professor vid University of California, Berkeley. Han är känd för sitt arbete inom kunskapsrepresentation, logik och probabilistisk AI. |
| 3  | Wes McKinney   | 1980         | Wes McKinney är en datavetare och författare till pandas-biblioteket, en Python-baserad mjukvarubibliotek för datamanipulation och analys. Han har också skrivit flera böcker om data science och Python-programmering. |


### Use JOIN to link two tables by column
Foreign key (relationsnyckel) => FörfattareID

  </div>


</div>


## Different types of join operations in SQL (and Pandas)

---

#### **Inner Join**: returns only the rows that have matching values in both tables being joined.
Default join type.

<code>
SELECT *

FROM table1

JOIN table2 ON table1.key_column = table2.key_column;</code>
</code>

Pandas:
<code>inner_join_df = pd.merge(df, df2, on='key_column', how='inner')</code>

---

#### **Left Join**: returns all the rows from the left table and the matching rows from the right table.
If there is no match in the right table, NULL values are returned.

<code>
SELECT *

FROM table1

LEFT JOIN table2 ON table1.key_column = table2.key_column;
</code>

Pandas:
<code>left_join_df = pd.merge(df, df2, on='key_column', how='left')</code>

---

#### **Right Join**: returns all the rows from the right table and the matching rows from the left table.
If there is no match in the left table, NULL values are returned.

<code>
SELECT *

FROM table1

RIGHT JOIN table2 ON table1.key_column = table2.key_column;
</code>

Pandas:
<code>right_join_df = pd.merge(df, df2, on='key_column', how='right')</code>

---

#### **Full Outer Join**: returns all the rows from both tables and includes NULL values for non-matching rows.

<code>
SELECT *

FROM table1

FULL OUTER JOIN table2 ON table1.key_column = table2.key_column;
</code>

Pandas:
<code>outer_join_df = pd.merge(df, df2, on='key_column', how='outer')</code>

---

#### **Cross Join**: returns the Cartesian product of the two tables, which means that all possible combinations of rows from both tables are returned.

<code>
SELECT *

FROM table1

CROSS JOIN table2;
</code>

Pandas:
<code>cross_join_df = df.assign(key=1).merge(df2.assign(key=1), on='key').drop('key', axis=1)</code>

---

Cross join always return (n_rows)*(n_rows) (Cartesian product) (least popular)



## **One-to-many and many-to-many** 
Types of relationships that can exist between two tables in a relational database.

<div style="display: flex; flex-direction: row;">
  <div style="flex: 1; margin:10px;">

**one-to-many**

A single record in one table is related to one or more records in another table.

For example, a country may have many cities in a table, and each city can be linked to only one country. This is a common relationship between a **parent table** and a **child table**, where the parent table holds the **primary key** that is referenced in the child table as a **foreign key**.

  </div>
  <div style="flex: 1; margin:10px;">

**many-to-many**

Multiple records in one table are related to multiple records in another table.

For example, a student can enroll in many courses, and a course can have many students enrolled. To represent this relationship in a relational database, we typically create a third table, known as a **junction** or **bridging table**, that links the two tables together. This junction table will hold foreign keys to both tables and may also contain additional information about the relationship, such as enrollment date or course grade.

  </div>
</div>