### Google Colab Integration

Die folgende Zelle können Sie überspringen, wenn Sie mit einer lokalen Installation arbeiten. Wenn Sie das Notebook auf Google-Colab ausführen, dann müssen Sie als erstes diese Zelle ausführen und danach die Seite neu laden (F5).

In [None]:
!echo "Update environment..."
!apt update -q  &> /dev/null
!echo "Install Java..."
!apt-get install -q openjdk-11-jdk-headless &> /dev/null
!echo "Install Jupyter java kernel..."
!curl -L https://github.com/SpencerPark/IJava/releases/download/v1.3.0/ijava-1.3.0.zip -o ijava-kernel.zip &> /dev/null
!unzip -q ijava-kernel.zip -d ijava-kernel && cd ijava-kernel && python3 install.py --sys-prefix &> /dev/null
!echo "Downloading turtle jar ..."
!curl -L https://github.com/Andreas-Forster/gyminf-programmieren/raw/master/notebooks/jturtle-0.6.jar -o jturtle-0.6.jar &> /dev/null
!echo "Done."

# Character und Strings

#### Marcel Lüthi, Departement Mathematik und Informatik, Universität Basel

### Datentyp Char

```java
char ch = 'x';
```

##### Zeichenkonstanten

Zeichen wird in einfache Hochkommas gesetzt.

Beispiele
* 'x' - Der Buchstaben x
* '0' - Das Zeichen (nicht Zahl) 0
* '?' - Fragezeichen

> Zeichen werden intern durch (Binär-)zahlen codiert

### Zeichencodes

ASCII-Code *(Ascii = American Standard Code for Information Interchange)*

![ascii](images/ascii.png)

### Unicode

Erweiterung des Zeichensatzes für die globale Welt.

|Wertebreich | Zeichenklasse |
|------------|---------------|
| 0 - 128    |  ASCII-Zeichen |
| 129 - 591  | Umlaute, Akzente, Sonderzeichen |
| 880 - 1023 | Griechische Zeichen |
| 1024-1279  | kyrillische Zeichen |
| 1536-1791  |  arabische Zeichen |


### Spezielle Zeichen in ASCII (und Unicode)

* `'\n'` Line feed
* `'\r'` Carriage return
* `'\t'` Tabulator
* `'\\'` Backslash \
* `'\''`  Hochkomma '

In [None]:
// probieren Sie es aus

System.out.print("*"); // markiert Anfang
System.out.print('a'); // Ihr Character
System.out.print("*"); // markiert Ende

### Zeichen-Operationen (I)

##### Zuweisungen 

```java 
char c1 = 'a';
```

Char kann int-Variable zugewiesen werden
```java
int i = c1;
```

Zuweisung von int-Variable zu char braucht Cast (warum?)
```java
char c2 = (char) i;
```

In [None]:
char c1 = (char) 97;
System.out.println(c1);

### Zeichen-Operationen (II)

##### Vergleiche

Übliche Zeichenoperationen (`==`, `!=`, `<`, `<=`, `>=`, `>`, `>=`) werden unterstützt
* Ordnung: gemäss Unicode-Wert

#### Arithmetische Operationen 

Char unterstützt die Operationen (`+`, `-`, `*`, `/`, `%`). 
* Ergebnistyp ist *int* 


### Standardfunktionen mit Zeichen

Die Java-Klasse Character definiert Standardfunktionen, um mit Character zu arbeiten

Beispiele:

* ```Character.isLetter(c)```  - Wahr, wenn c ein Unicode-Buchstabe ist
* ```Character.isDigit(c)``` - Wahr, wenn c eine Ziffer ist
* ```Character.isLowerCase(c)``` - Wahr, wenn c ein Kleinbuchstabe ist
* ```Character.toUpperCase(c)``` - Wandelt Zeichen c in Grossbuchstabe um 


#### Miniübung

* Was gibt folgendes Programm aus? Weshalb?

```java
char c = '7';
System.out.println(c - '0');
```

* Schreiben Sie ein Programm, welche die ersten 128 Unicode Zeichen ausgibt. 
* Experimentieren Sie mit den Methoden in der Klasse Character. Eine Liste aller Methoden erhalten Sie, wenn Sie Character. in eine Codezelle schreiben und danach die Tab Taste drücken. 
* Definieren Sie ein Array von Charactern, welches dem Text "hello world" entspricht.
    * Schreiben Sie eine Methode ```printText```, die ein Char-Array nimmt und dieses mithilfe der Methode ```System.out.print``` ausgibt.
* Schreiben Sie eine Methode ```boolean containsPattern(char[] pat, char[] text)```, welches true zurückgibt, wenn die Zeichen in ```pat``` als Zeichenfolge im Text ```text``` vorkommen. 

In [None]:
char c = '7';
System.out.println(c - '0'); // yields the number 7

// First 128 unicode characters
for (int i = 0 ; i < 128; i++) {
    char c = (char) i;
    System.out.print(c);
}


In [None]:
char[] text = {'h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd'};
void printText(char[] text) {
    for (int i = 0; i < text.length; i++) {
        System.out.print(text[i]);
    }
}
printText(text);

In [None]:
boolean containsPatterns(char[] text, char[] pattern) {

    for (int i = 0; i <= text.length - pattern.length; i++) {
        if (text[i] == pat[0]) {
             int j = 1; 
             while (j < pattern.length && pattern[j] == text[i + j]) {
                 j++;
             }  
             
            if (j == pattern.length) {
                return true;
            }
         }
     }
    return false;
}

char[] pat = {'r', 'l', 'd'};
containsPatterns(text, pat);

### Strings

```String```: Standard-Datentyp von Java, um Zeichenketten zu repräsentieren.


##### Stringkonstanten

Zeichenketten werden in doppelte Hochkommas gesetzt. 

#### Initialisierung

Direkt mit Stringkonstante 
```java 
String s = "hello world";
```
oder 

explizit mit ```new``` Operator 
```java
String s = new String("hello world");
```


### Gleichheit von Strings

String ist (wie Array) ein Referenzdatentyp. 

* Stringvariable enthält nur Referenz auf Zeichenkette
* Gleichheitsoperator ```==``` vergleicht Referenzen und nicht Inhalt

> Vergleich von Strings erfolgt mittels der Methode ```equals```;



In [None]:
String s1 = new String("abc");
String s2 = new String("abc");

System.out.println(s1 == s2);
System.out.println(s1.equals(s2));

### Stringkonkatenation

```s1 + s2``` Erzeugt neues Stringobjekt durch Verkettung von ```s1``` und ```s2```

* Relativ teure Operation


In [None]:
String s1 = "hello ";;
String s2 = "world";

String s3 = s1 + s2;
System.out.println(s3);
// oder direkt
System.out.println(s1 + s2);

### Standardfunktionen auf Strings

Die Klasse String definiert viele nützliche Standardfunktionen

Beispiele:
```java 
String s = "a long String";
```

* ```int len = s.length()``` - Länge vom String
* ```char ch = s.charAt(3)``` - Zeichen mit Index 3 (viertes Zeichen) im String
* ```int i = s.indexOf("ng")``` Liefert Index des 1. Vorkommens von "ng" in ```s``` (hier 4)
* ```int i = s.indexOf("ng", 5)``` Liefert Index des 1. Vorkommens von "ng" in ```s``` ab Position 5 (hier 11)
* ```String x = s.substring(2, 6); ``` Liefert Teilstring ```s[2..5]``` (hier "long")
* ```s.startsWith("abc")```Gibt Wahr, falls ```s``` mit "abc" beginnt.



In [None]:
String s = "hello";
s.

#### Miniübungen

* Explorieren Sie welche Methoden Sie auf Strings zur Verfügung haben. Sie erhalten eine Liste der Methoden indem sie in einer Codezelle ein String Objekt mit anschliessenden Punkt schreiben (also z.b "abc".) und danach die Tabulatortaste drücken.
* Experimentieren Sie mit den verschiedenen Methoden.
* Finden Sie eine Methode, mit der Sie einen gegebenen String verändern können?

#### Aufbauen von String mit StringBuffer

> StringBuffer: Wie String, aber modifizierbar

StringBuffer erzeugen
```java
StringBuffer sb = new StringBuffer();
```

Werte hinzufügen
```java
sb.append("a");
sb.append(7);
sb.append('c')
```

In String umwandeln
```java
String s = sb.toString();
```


### Miniübung

* Implementieren Sie eine Methode ```reverse```, die einen String als Argument nimmt und den String rückwärts zurückgibt. Also "abc" wird zu "cba". Nutzen Sie dazu einen StringBuffer.
* Welche anderen Methoden stellt StringBuffer zur Verfügung? Experimentieren Sie.



In [None]:
String reverse(String s) {
    StringBuffer sb = new StringBuffer();
    for (int i = s.length() - 1; i >= 0; i--) {
        sb.append(s.charAt(i));
    }
    return sb.toString();
}
reverse("reverse");