# Napisy (łańcuchy znakowe)

* napisy to ciąg znaków umieszczony między `'apostrofami'` 
* napis w Matlab to wektor znaków
* macierz znakowa - macierz zawierająca napisy w wierszach, wiersze macierzy posiadają tyle samo elementów, więc krótsze napisy są wypełnione blankami/spacjami
* od Matlab R2016 istnieje także obiekt (typ) `string`, który reprezentuje napisy umieszczone w `"cudzysłowach"` (ale my zajmiemy się tylko tablicami znaków)


In [None]:
napis = 'Ala ma kota'
a = length(napis)
whos napis 

In [None]:
c = length('')     % pusty napis
b = length(' ')    % znak spacji

## Napis jest wektorem
* indeksowanie macierzowe
* operacje na macierzach (np. transpozycja)

In [None]:
napis = 'Ala ma kota';
a = napis(1)
b = napis(end)
c = napis(2:2:end)
d = napis(1:5)'

**Ćwiczenie** napisz funkcję `anagram(s)`, która dla podanego napisu (wyrazu) zwróci jego anagram (przestawi znaki w losowej kolejności).  
Wskazówka: funkcja `randperm()` zwraca losową permutację liczb całkowitych

## Macierze znaków

* macierz zawierająca napis (tablicę znaków) w każdym wierszu
* długość wierszy musi być taka sama

In [None]:
X = [ 'Ala' ; 'Ewa'; 'Jan'] 

% piwrsza kolumna znaków
a = X(:, 1) 

% transpozycja macierzy
b = X'

Funkcja `char(s1, s2, ...)` tworzy macierz z napisów `s1`, `s2`, itd. 

In [None]:
X = [ 'Ala' ; 'Zuzanna']  

whos
% uwaga: w Matlab ta operacja powoduje błąd, nie zgadzają się długości napisów. W Octave pierwszy wiersz jest uzupełniony spacjami
% Do tworzenia macierzy znakowej można wykorzystać char(), który uzupełni krótsze linie spacjami

X = char('Ala', 'Zuzanna', 'Hermenegilda')

## Łączenie napisów

* łączenie napisów (concatenation)  `[napis1 napis2]` 
* funkcja `strcat(napis1, napis2)` 

In [None]:
a = 'Ala';
b = ' ma kota';
x = [a b]
y = [x ' a Ewa ma psa']

In [None]:
z = strcat(a, b, ' a Janek nie')
whos a b c

## Łączenie napisów wertykalnie

* łaczenie napisów wertykalne (dodawanie wierszy) `[napis1 ; napis2]`   
* funkcja `strvcat(napis1, napis2)`

In [None]:
a = 'Raz';
b = 'Dwa';
c = 'Trzy'; 

% w Matlab problem bo wiersze o różnej długości
x = [a ; b; c]     

In [None]:
% w Matlab działa, krótsze wiersze zostają uzupełnione spacjami 
y = strvcat(a, b, c)

whos a b c x y

## Typ znakowy

* znaki są kodowane za pomocą liczb całkowitych (kod ASCII)
* `char(liczba)` zwraca symbol kodowany daną liczbą
* `double(znak)` zwraca liczbę kodującą znak

In [None]:
a = char(65)
b = double('A')

In [None]:
napis = 'Ala ma kota'
b = double(napis)
b = napis + 1
c = char(napis + 3)

**Ćwiczenie:** wypisz wartości numeryczne i odpowiadające symbole kodu ASCII dla znaków kodowanych od 1 do 127 

## Znak nowej linii

* `char(10)`
* `newline`  (brak w Octave)
* `sprintf('\n')`
* uwaga: w Windows na końcu linii są 2 bajty `\r\n` 


In [None]:
x = ['Ala ' newline 'ma' char(10) 'kota']

**Ćwiczenie:** wyświetl wartość liczbową kodu ASCII odpowiadającą znakowi powrotu karetki `\r`

## Przydatne funkcje operujące na napisach

Funkcja | Opis |
:-|:-|
`strcat()` `strvcat()`| łączenie napisów |  
`blanks(N)` | tworzy napis (wektor) białych znaków (spacji)  |
`sprintf()` | tworzenie napisów z formatowanymi wartościami |
`strcmp(A, B)` | porównywanie napisów |
`strtrim(x)`     | usuwa białe znaki z poczatku i z końca napisu | 
`lower(x)`       | zamiana znaków na małe litery |
`upper(x)`       | zamiana znaków na wielkie litery |
`findstr(s1, s2)` | szuka wzorca `s2` w napisie `s1` |
`strrep(s, w, x)` | zamiana w napisie `s` wystąpienia wzorca `w` na `x` |
`strtok(s, d)`    | dzieli napis `s` na części oddzielone separatorem `d` |

W Matlab zobacz `help strfun`

## blanks

In [None]:
a = blanks(10)
x = double(a)

In [None]:
b = ['Ala' blanks(5) 'ma' blanks(5) 'kota']
c = ['Ala' ; blanks(5)' ; 'ma' blanks(5) 'kota']

% w Matlab raczej to
c = char('Ala', blanks(5)','ma',blanks(5), 'kota')

## sprintf

działa identycznie jak `fprintf` ale wynikowy napis jest zwracany (nie wyświetlany)

In [None]:
a = sprintf('Liczba PI wynosi %.2f', pi )
x = 65
b = sprintf('Liczba %d, znak %c\n\nliczba %x\n', x, x, x)

In [None]:
% sprintf z macierzami w argumentach
x = [1 2 3]
a = sprintf('Liczba %d, ', x)
a = sprintf('Liczba %d, ', x')
x = [1 2 ; 3 4]
a = sprintf('Liczba %d, ', x)

## strtrim

usuwa białe znaki z początku i końca napisu

In [None]:
X = [ blanks(5) 'matlab' blanks(5) 'jest fajny' blanks(5)]
a = strtrim(X)

## lower, upper

In [None]:
X = 'Ala ma KoTa 123!@#'
a = lower(X)
b = upper(X)

**Ćwiczcie** zamień w napisie duże litery na małe bez używania funkcji `lower` ?

## Porównywanie napisów

* funkcja `strcmp(S1, S2)` zwraca 1 gdy napisy `s1` i `s2` są identyczne 
* funkcja `strcmpi(S1, S2)` zwraca 1 gdy napisy `s1` i `s2` różnią sie wyłącznie wielkością liter 



In [None]:

x = 'abcd'
y = 'abcD'

a = x == y 
b = x < y    % porównywanie wartości liczbowych w macierzach

c = strcmp(x, y)

d = strcmpi(x, y)


## Wyszukiwanie podciągów

* funkcja `strfind(s, w)` zwraca indeksy początku wzorca `w` w napisie `s`


In [None]:
napis = 'Siała baba mak'

a = strfind(napis, 'abc')
b = strfind(napis, 'mak')
c = strfind(napis, 'a')
napis(c)

## Zamiana fragmentow napisów

* funkcja `strrep(s, w, x)` zamienia w napisie `s` wystąpienia wzorca `w` na napis `x`

In [None]:
napis = 'siała baba mak'
napis = strrep(napis, 'baba', 'kobieta')

## Podział napisów względem separaotra

* funkcja `strtok(s, d)` dzieli napis `s` na część przed separatorem (token) `d` oraz część pozostałą. Domyślnie separatorem jest spacja.

In [None]:
napis = 'siała baba mak'
[token reszta] = strtok(napis)

[token reszta] = strtok(napis, 'a')

[token reszta] = strtok(napis, 'baba')

## Funkcje sprawdzające zawartość napisow

Funkcja | Opis |
:-|:-|
`isletter(s)` | czy litera |
`isspace(s)` | czy spacja  |
`islower(s)` | czy mała litera alfabetu  |
`isupper(s)` | czy duża litera alfabetu   |
`isdigit(s)` | czy cyfra |
`ischar(s)`  | czy napis |


In [None]:
napis = 'abc ABC 123\n!@#'
a = isletter(napis)
b = isspace(napis)
c = islower(napis)
d = isupper(napis)
e = isdigit(napis)
e = ischar(napis)
f = ischar([ 1 2 3])

## Zamiana liczb na napisy 

Funkcja | Opis |
:-|:-|
`int2str(x)` | zamiana liczby całkowitej na napis |
`num2str(x)` | zamiana liczby na napis  |
`sprintf()`  | również pozwala na zmiane liczby na napis |
`str2num(s)`  | zamiana napisu na liczbę |`

In [None]:
a = int2str(65)
double(a)     % 54 to cyfra '6', wartość 53 to cyfra '5'
printf('%s\n', a)

In [None]:
b = num2str(pi)
b(1:2)

In [None]:
c = str2num(b)
d = str2num('1 2 3.5')
whos a b c d

## Sortowanie znaków

* funkcja `sort()` zwraca znaki w rosnącej kolejności

In [None]:
x = 'Ala ma kota'
sort(x)

x = ['Ala' ; 'ma ' ; 'psa']
sort(x, 2)

## Zadanie 7. Szyfr

Napisz funkcję o nazwe `dekoduj()`, która odszyfruje wiadomość ukrytą w pierwszych literach wyrazów podanego napisu. Dla podanego w argumencie funkcji łańcucha znakowego zawierającego dowolnie długi tekst funkcja zwraca łancuch znakowy zawierający litery początkowe wyrazów. Wynik zawiera wyłacznie małe litery, jeżeli pierwsza litera wejściowego wyrazu była duża to zamieniamy ją na małą. Wyrazem jest dowolny ciąg składający się z liter (dużych lub małych) lub cyfr. Zwróć uwagę na to, że tekst może zawierać wiele innych znaków z kodu ASCII (np. `#$\_`), które mogą oddzielać wyrazy (ciągi liter i cyfr). W przypadku, gdy użytkownik wywoła funkcję bez podania argumentu wejściowego lub poda więcej argumentów niż 1 wówczas funkcja wyświetli stosowany komunikat błędu za pomocą funkcji `error()`. Komunikat błedu pojawi się również, gdy podany argument nie będzie tablicą znakową.


Przykładowo, wywołanie funkcji
```
dekoduj('Ala ma kota');
```
zwróci napis `'amk'`

Inny przykład, dla danej tablicy `x`
```
x = '  **mbnv,AaA[(T)]     l123|A||B  '
```
wywołanie funkcji `dekoduj(x)` zwróci napis `'matlab'`