# Программирование для журналистики данных
## Занятие 3
_Илья Щуров_

[Страница курса](http://math-info.hse.ru/s17/1)

В прошлый раз мы обсуждали списки. Помимо списков в Python существуют *кортежи*. Они выглядят как списки, только отличается тем, что их нельзя изменить.

In [2]:
my_tuple = (1, 5, 15, "Hello")

In [3]:
my_tuple[2]

15

In [4]:
my_tuple[2] = 3

TypeError: 'tuple' object does not support item assignment

In [5]:
my_tuple.append(10)

AttributeError: 'tuple' object has no attribute 'append'

В некоторых случаях это бывает полезно. (Но в первую очередь нужно знать, что так в принципе бывает.)

Вообще это важная и не очень простая концепция. В Python бывают такие объекты, которые можно менять, а бывают такие, которые нельзя. Вот, например, строки нельзя менять.

In [7]:
s = "Hello World"

In [8]:
s.append("!")

AttributeError: 'str' object has no attribute 'append'

Но это не значит, что я не могу создать новую строку, используя старую. Например, вот так:

In [9]:
s = s + ", this is a test"

In [10]:
s

'Hello World, this is a test'

Что здесь произошло? Сначала я создал новую строку, которую получил, приписыванием к строке, хранившейся в переменной `s`, строки `", this is a test"`. Затем я сказал, что теперь вот эта самая новая строка будет называться так, как раньше называлась старая — её именем будет `s`. Теперь переменная `s` указывает на новую строку, а старая (в которой было `"Hello World"` всеми забыта (и может быть вообще не существует).

Поскольку строки неизменяемы, соответствующие методы строк просто возвращают новую строку в качестве результата своего выполнения. Например, у строк есть метод `.replace()`, заменяющий подстроки. Вот, скажем, заменим все пробелы в строке `s` на серии из четырёх минусов.

In [11]:
s_with_dashes = s.replace(" ", "----")

In [12]:
s_with_dashes

'Hello----World,----this----is----a----test'

Заметим, что сама переменная `s` при этом не изменилась. (И не могла измениться, потому что строки неизменяемы.)

In [13]:
s

'Hello World, this is a test'

In [14]:
s_with_dashes

'Hello----World,----this----is----a----test'

Поэтому если я напишу что-нибудь вроде

    s.replace(' - ', ' --- ')

где-либо в коде, то эта строчка будет довольно бессмысленной. Она создаёт новую строку, но никуда её не записывает, а тут же забывает. Если я хочу запомнить результат выполнения такой операции и как-то его использовать в дальнейшем (а я наверняка хочу, иначе зачем бы я стал её делать), его надо записать в какую-нибудь переменную. Для этого можно использовать ту же самую переменную `s` (если её старое значение нам больше не требуется) или придумать какое-нибудь другое имя.

In [16]:
s = 'Moscow - the capital of Russia'
s = s.replace(' - ', ' --- ')
print(s)

Moscow --- the capital of Russia


У строк бывают другие методы. Например, `.capitalize()` делает первую букву большой.

In [17]:
"hello, world".capitalize()

'Hello, world'

А вот так можно применять несколько методов последовательно.

In [19]:
words = "hello, world".capitalize().split()

In [20]:
words

['Hello,', 'world']

Здесь мы к строке `"hello, world"` сначала применяем метод `.capitalize()`, получаем новую строку — `"Hello, world"`, а затем к этой новой строке применяем метод `.split()`, который разбивает строку по пробелам и возвращает список отдельных слов.

In [21]:
words[0]

'Hello,'

Вообще метод `.split()`, если его вызывать вот так, без аргументов, разделяет строку на слова, используя в качестве разделителя любые последовательности пробелов, табуляций и символов перевода строки.

In [23]:
s = "Hello  \t  \n\n   World!"
print(s)
print(s.split())

Hello  	  

   World!
['Hello', 'World!']


Вот более сложный пример

In [24]:
sentence = "Hello, world! This is a test."
sentence_without_commas = sentence.replace(",", " ")
sentence_without_periods = sentence_without_commas.replace(".", " ")
sentence_without_excls = sentence_without_periods.replace("!", " ")
words = sentence_without_excls.split()
print(words)

['Hello', 'world', 'This', 'is', 'a', 'test']


Его можно было бы кратко записать так.

In [26]:
words = ("Hello, world! This is a test." # переход на новую строку здесь не играет роли
      .replace(",", " ")
      .replace(".", " ")
      .replace("!", " ")
      .split()) 
print(words)
# words = ['Hello', 'world', 'This', 'is', 'a', 'test']
for word in words:
    print(word)

['Hello', 'world', 'This', 'is', 'a', 'test']
Hello
world
This
is
a
test


In [28]:
# когда мы делаем цикл, происходит что-то в таком роде

words = ['Hello', 'world', 'This', 'is', 'a', 'test']

word = words[0]
print(word)

word = words[1]
print(word)

word = words[2]
print(word)

word = words[4]
print(word)

word = words[5]
print(word)

Hello
world
This
a
test


Заметим, что со списками всё не так. Когда мы применяем операцию к списку, как правило, эта операция ничего не возвращет, но зато исходный список модифицируется.

In [29]:
x = [1, 10]

In [30]:
x.insert(1, 5)

In [31]:
x

[1, 5, 10]

Если бы мы попробовали присвоить результат выполнения команды `x.insert(1, 5)` какой-нибудь переменной, то этой переменной присвоилось бы значение `None`.

In [32]:
x = [1, 10]
y = x.insert(1, 5)
print(y)

None


### Задача
Вывести квадраты всех чисел между двумя заданными целыми числами.

In [33]:
for i in range(2, 10):
    print(i, i ** 2)

2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81


### Задача
Дана переменная

    names = "Ann Bob Claudia Daniel"

Хочу получить список, каждый элемент которого является строкой

    ["Ann Smith", "Bob Smith", "Claudia Smith", "Daniel Smith"]


In [35]:
names = "Ann Bob Claudia Daniel"
full_names = []
splitted_names = names.split()
for name in splitted_names:
    full_names.append(name + " Smith")
print(full_names)

['Ann Smith', 'Bob Smith', 'Claudia Smith', 'Daniel Smith']


In [36]:
# Другая задача: создать список из квадратов целых чисел
squares = []
for i in range(0, 10):
    squares.append(i ** 2)
print(squares)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
