# The strange case of `String`

Over de gelijkwaardigheid van strings.

## Equality operator

Voor het vergelijken van waarden wordt de gelijkheid-operator `==` gebruikt. Laten we dit eens proberen voor typen die we al gezien hebben, hele getallen (`int`) en strings (`String`).

In [1]:
int number_one = 42;
int number_two = 42;
int number_three = 43;

String string_one = "Hello world!";
String string_two = "Hello world!";
String string_three = "Hello again!";

De gelijkwaardingheid van getallen:

In [2]:
number_one == number_two

true

In [3]:
number_two == number_three

false

De gelijkwaardigheid van strings:

In [4]:
string_one == string_two

true

In [5]:
string_two == string_three

false

Tot zover alles goed! Maar er is iets speciaals met `String`. Het is geen primitief type zoals `int`, maar een klasse, zodat we `String` instanties kunnen maken met het `new` keyword. 

In [6]:
String string_four = new String("Hello world!")

In [7]:
string_four

Hello world!

Perfect, hier hebben we onze string en het heeft dezelfde waarde als `string_one` die we eerder gedefinieerd hebben. Laten we voor de zekerheid nog een keer controleren ze gelijk aan elkaar zijn.

In [8]:
string_one == string_four

false

Hmm, dit is vreemd omdat ze hetzelfde zouden moeten zijn ... ? Laten we een variatie proberen door een tweede instantie te maken met dezelfde waarde.

In [9]:
String string_five = new String("Hello world!")

En laten we weer op gelijkheid controleren.

In [10]:
string_four == string_five

false

Ze zijn nog steeds niet hetzelfde! Laten we nog een variatie proberen door een kopie te maken. Kopieën zouden gelijk moeten zijn, toch?

In [11]:
String string_six = string_five

In [12]:
string_five == string_six

true

Het vergelijken van een kopie werkt zoals verwacht. Wanneer we een `String` object inspecteren zullen we zien dat het een `equals` methode heeft. Zou dit iets zijn wat we kunnen of moeten gebruiken? (het boek zegt dat we dat zouden moeten doen!)

In [13]:
string_four.equals(string_five)

true

We hebben eindelijk gelijkheid, maar blijkbaar alleen bij het vergelijken van kopieën van instanties of bij gebruik van de `equals` methode, wat is hier aan de hand?!? Om dit gedrag te begrijpen moeten we twee dingen leren:

1. Het bestaan van de *String Constant Pool*
2. Het verschil tussen `String` *literals* en `String` *objects*

## String literals en String objects

We hebben gezien dat we op twee manieren strings kunnen maken. Deze eerste toewijzingsnotatie wordt een *string literal* genoemd:

```java
String string_one = "Hallo wereld!";
```

De tweede notatie heet een string *object*, omdat dit de manier is waarop we normaal gesproken instanties maken in Java:

```java
String string_four = new String("Hello world!");
```

Zowel `string_one` als `string_two` zullen `String` instanties zijn, d.w.z. ze zullen van hetzelfde *type* zijn. Maar waarom evalueren ze niet als waar wanneer ze met elkaar vergeleken worden? Dit heeft alles te maken met het feit dat Java iets extra's doet als het om string-literals gaat, en dit is waar de *String Constant Pool* in het spel komt ...

Bij gebruik van een *string literal* zal de Java Virtual Machine (kortweg JVM, die de gecompileerde code uitvoert) het aangemaakte object toevoegen aan de *String Constant Pool*. Je kunt deze pool vergelijken met een cache en de variabele (bijvoorbeeld onze `string_one`) zal een "pointer" (een verwijzing) worden naar het object dat in de pool is opgeslagen. Wanneer je een tweede string literal maakt met dezelfde waarde (onze `string_two`) en de JVM vindt de waarde van dit object in de pool, dan zal het verwijzen naar dat eerste object en zal *niet* een nieuwe instantie in de pool aanmaken.

De reden waarom dit wordt gedaan is vanwege efficiëntie: het is een *optimalisatie* stap.  Wanneer je veel string-literals maakt met dezelfde waarde (bijv. "Hallo wereld!") dan zal er slechts één object in het geheugen worden bewaard en dit verklaart waarom de gelijkheid-operator `==` werkt zoals verwacht met string-literals: als ze gelijk zijn dan zullen ze verwijzen naar hetzelfde object in de pool!

In tegenstelling tot string-literals worden *string objecten* niet in de pool bewaard, twee string-objecten die met dezelfde waarde worden aangemaakt zullen echt twee aparte objecten zijn. En omdat de gelijkheidsoperator `==` gebonden is aan het pool-gedrag (d.w.z. controleren of de objectwaarde in de pool zit of niet) zal het vergelijken van twee verschillende string-objecten mislukken. Dit is waarom men expliciet de `equals` methode moet gebruiken om de *eigenlijke waarde* van verschillende string objecten te vergelijken.

Voor velen (en zeker voor mensen die nieuw zijn in de Java taal) kan dit gedrag een grote bron van verwarring (en frustratie!) zijn.