Cheatsheet
# Julia | Chaines de caractères

- [Caratères](#caractères)
- [Chaines de caractères](#strings)
- [Itération sur une chaine de caractères](#itération-sur-une-chaine-de-caractères)
- [Concaténation](#concaténation)
- [Interpolation](#interpolation)
- [Occurences](#occurences)
- [Jointures](#jointures)
- [RegEx](#regex)
- [Longueur de chaines](#longueur)
- [Remplacer](#remplacer)
- [Substrings](#substrings)

## caractères

In [1]:
c = 'a' # les caractères sont entre guillemets simples

'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)

In [2]:
c = Int(c) # il est possible de coder un caractère sous la forme d'un entier

97

In [3]:
Char(97)

'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)

In [4]:
'A' < 'a' # il est donc possible d'effectuer des comparaisons...

true

In [5]:
'A' + 1 #... ou des opérations arithmétiques

'B': ASCII/Unicode U+0042 (category Lu: Letter, uppercase)

## Strings

In [6]:
str = "Hello World!" # entre guillemets doubles...

"Hello World!"

In [7]:
#... ou triple s'il y a des guillemets doubles dedans
str = """Victore Hugo a prononcé la phrase "Ce gouvernement, je le caractérise d'un mot : la police partout, la justice nulle part" le 17 juillet 1851."""

"Victore Hugo a prononcé la phrase \"Ce gouvernement, je le caractérise d'un mot : la police partout, la justice nulle part\" le 17 juillet 1851."

In [8]:
typeof(str)

String

## Itération sur une chaine de caractères

In [9]:
for c in str
    println(c)
end

V
i
c
t
o
r
e
 
H
u
g
o
 
a
 
p
r
o
n
o
n
c
é
 
l
a
 
p
h
r
a
s
e
 
"
C
e
 
g
o
u
v
e
r
n
e
m
e
n
t
,
 
j
e
 
l
e
 
c
a
r
a
c
t
é
r
i
s
e
 
d
'
u
n
 
m
o
t
 
:
 
l
a
 
p
o
l
i
c
e
 
p
a
r
t
o
u
t
,
 
l
a
 
j
u
s
t
i
c
e
 
n
u
l
l
e
 
p
a
r
t
"
 
l
e
 
1
7
 
j
u
i
l
l
e
t
 
1
8
5
1
.


## Concaténation

In [10]:
"Hello"*" "*"World"*"!"

"Hello World!"

## Interpolation

In [11]:
surname = "Hugo"
forename = "Victor"
fullname = "$forename $surname"

"Victor Hugo"

## Occurences

In [12]:
findfirst('l', "Hello World")

3

In [13]:
findlast('l', "Hello World")

10

In [14]:
findprev('l', "Hello World", 5)

4

In [15]:
findnext('l', "Hello World", 5)

10

In [16]:
findall('l', "Hello World")

3-element Vector{Int64}:
  3
  4
 10

In [17]:
occursin("world", "Hello world!")

true

In [18]:
occursin("Goodbye", "Hello world!")

false

## Jointures

In [19]:
jours = ["lundi", "mardi", "mercredi", "jeudi", "vendredi", "samedi", "dimanche"]

7-element Vector{String}:
 "lundi"
 "mardi"
 "mercredi"
 "jeudi"
 "vendredi"
 "samedi"
 "dimanche"

In [20]:
join(jours, ", ", " et ")

"lundi, mardi, mercredi, jeudi, vendredi, samedi et dimanche"

## RegEx

In [21]:
str = "Hello World!"

"Hello World!"

In [22]:
r = r"l"

r"l"

In [23]:
typeof(r)

Regex

In [24]:
occursin(r, str) #occursin retourne vrai ou faux

true

In [25]:
match(r, str)

RegexMatch("l")

In [26]:
m = match(r"[0-9]", str) #si aucun match retour "nothing"

In [27]:
if m === nothing
    return "no match"
else
    return "match"
end

"no match"

In [28]:
m = match(r"(ll).*(l)", str)

RegexMatch("llo Worl", 1="ll", 2="l")

In [29]:
m.match

"llo Worl"

In [30]:
m.captures

2-element Vector{Union{Nothing, SubString{String}}}:
 "ll"
 "l"

In [31]:
m = match(r"(?<hour>\d+):(?<minute>\d+)","12:45")

RegexMatch("12:45", hour="12", minute="45")

In [32]:
m[:minute]

"45"

In [33]:
m[2]

"45"

In [34]:
m = eachmatch(r, str)

Base.RegexMatchIterator(r"l", "Hello World!", false)

In [35]:
collect(m)

3-element Vector{RegexMatch}:
 RegexMatch("l")
 RegexMatch("l")
 RegexMatch("l")

In [36]:
[m.match for m = eachmatch(r, str)]

3-element Vector{SubString{String}}:
 "l"
 "l"
 "l"

## Longueur

In [37]:
str = "Bodø est une ville norvégienne située dans le comté de Nordland"

"Bodø est une ville norvégienne située dans le comté de Nordland"

In [38]:
length(str)

63

In [39]:
lastindex(str) # attention à l'encodage des caractères, length() et lastindex() ne retournent pas toujours le même résultat

67

## Remplacer

In [40]:
str = "Hello World!"
replace(str, "Hello" => "Goodbye")

"Goodbye World!"

## Substrings

In [41]:
str[2]

'e': ASCII/Unicode U+0065 (category Ll: Letter, lowercase)

In [42]:
str[1:5]

"Hello"

In [43]:
str[begin:end-6]

"Hello "

In [44]:
str[1]

'H': ASCII/Unicode U+0048 (category Lu: Letter, uppercase)

In [45]:
str[1:1]

"H"

In [46]:
typeof(str[1:5])

String

In [47]:
SubString(str, 1, 5)

"Hello"

In [48]:
typeof(SubString(str, 1, 5))

SubString{String}