# Циклы, функции, генераторы, list comprehension

### Условный оператор

In [1]:
x = True
if x:
    print 'Ok'
else:
    print 'Not Ok :)'

Ok


In [2]:
x = False
if x:
    print 'Ok'
else:
    print 'Not Ok :)'

Not Ok :)


Здесь все точно так же, как и в других языках программирования, однако во многих языках, когда мы пишем какую-то конструкцию, тело пишется в скобочках, но в Python для этого используются отступы. 

Оступы должны быть единообразными, то есть если мы отсупили на Tab, то и продолжает делать такие же отсупы дальше.

In [3]:
x = True
if x:
    print 'Ok'
    print 'Ok2'
else:
    print 'Not Ok :3'

Ok
Ok2


### Циклы

Напишем простой цикл, в котором будем выводить числа от 1 до 10. В этой программе числа выведутся от 0 до 9 (10 не входит в интервал), чтобы вывод начался с единицы нужно написать range(1, 10).

In [4]:
for i in range(10):
    print i

0
1
2
3
4
5
6
7
8
9


In [5]:
for i in range(1, 10):
    print i

1
2
3
4
5
6
7
8
9


In [6]:
for i in range(1, 10):
    print i,

1 2 3 4 5 6 7 8 9


Когда делается print, то сразу же происходит перевод на следующую строку, если мы хотим писать все на одной строке, то можно поставить запятую после i.

In [7]:
print range(2, 5)

[2, 3, 4]


In [8]:
for i in [2, 3, 4]:
    print i

2
3
4


In [9]:
type(range(2, 5))

list

Range это не диапозон значений, мы просто пробегаемся по какому-то контейнеру с элементами. Если узнаем тип range(2, 5), то это будет список.

In [10]:
for i in xrange(2, 5):
    print i

2
3
4


In [11]:
type(xrange(2, 5))

xrange

In [12]:
print xrange(2, 5)

xrange(2, 5)


Xrange естественный пример генератора. Он не представляет из себя сразу готовый список различных значений, а генерирует их на ходу. То есть в памяти не будет храниться длинный список, как если вы напишите range, поэтому лучше писать for i in xrange, если число большое.

### List comprehension

В Python многие вещи можно писать через одну строчку.

In [13]:
print [x ** 2 for x in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [14]:
print [x ** 2 for x in range(1, 11) if x % 2 == 0]

[4, 16, 36, 64, 100]


In [15]:
w = [x ** 2 for x in range(1, 11) if x % 2 == 0]

In [16]:
print type(w)

<type 'list'>


In [17]:
w1 = (x ** 2 for x in range(1, 11) if x % 2 == 0)

In [18]:
print type(w1)

<type 'generator'>


Тип этого объекта список, но, чтобы сделать генератор (в таком случае мы не будет хранить все эти значения в памяти), нужно заменить квадратные скобочки на круглые.

Таким образом, range отличается от xrange тем, чем в этом выражении отличаются квадратные скобочки от круглых.

In [20]:
x = True
a = 0
while x:
    a += 1
    print a
    if a > 10:
        break

1
2
3
4
5
6
7
8
9
10
11


Вместо for можно написать цикл и через while. В цикле можно использовать break, continue (приводит сразу к переходу на следующую итерацию).

In [23]:
x = True
a = 0
while x:
    a += 1
    if a % 2 == 0:
        print 'Continue'
        continue
    print a
    if a > 10:
        break

1
Continue
3
Continue
5
Continue
7
Continue
9
Continue
11


### Функции

In [24]:
def myrange(a, b):
    res = []
    s = a
    while s != b:
        res.append(s)
        s += 1
    return res

In [25]:
print myrange(2, 7)

[2, 3, 4, 5, 6]


Необязательно писать for x in range(10), этот же результат можно получить, используя функцию map. Эта функция просто применяет некоторую функцию к контейнеру.

In [26]:
[x ** 2 for x in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [27]:
def sq(x):
    return x ** 2
print map(sq, range(10))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Вместо такой функции мы можем определять функции прямо на ходу с помощью лямбда-выражений.

In [28]:
print map(lambda x: x**2, range(10))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


# Работа с файлами

 ### Чтение данных из файла

Часто для анализа требуется использовать данные, хранящиеся в каком-то файле. Это может быть электронная таблица, текстовый документ, html-документ и т.д.

In [29]:
?open

Чтобы разобраться с функцией, можно почитать ее Docstring, для это нужно написать вопросительный знак, а после него без пробела необходимую функцию.

In [41]:
file_obj = open('example.txt', 'r')

По умолчанию файл открывается в режиме чтения. Если файл лежит в той же директории, что и ipython, то можно просто написать его имя, в противном случае придется писать путь.

In [32]:
type(file_obj)

file

In [42]:
print file_obj.read()

Привет! Как дела?
Ничего себе!


С помощью read() можно вывести содержимое файла на экран. Если мы хотим считывать файл по строкам, то для этого можно воспользоваться функцией readline().

In [43]:
file_obj = open('example.txt', 'r')
print file_obj.readline()

Привет! Как дела?



In [44]:
print file_obj.readline()

Ничего себе!


In [45]:
print file_obj.readline()




Вывод пустой строки означает конец файла.

Для того чтобы обращаться к файлу построчно необязательно использовать read и readline, мы можем обращаться с файлом как с обычным генератором.

In [46]:
file_obj = open('example.txt', 'r')

In [47]:
for line in file_obj:
    print line.strip()

Привет! Как дела?
Ничего себе!


Функция strip() помогает отрезать нам от конца каждой строки пробельные символы (пробелы, знаки табуляции, знаки переноса строки).

In [48]:
file_obj = open('example.txt', 'r')
data_list = list(file_obj)

In [51]:
for line in data_list:
    print line.strip()

Привет! Как дела?
Ничего себе!


Когда мы хотим работать со строками файла как с массивом, когда каждому элементу списка соответствует строка файлы, мы можем изменить тип объекта file на список и работать дальше с ним как со списком.

In [52]:
file_obj = open('example.txt', 'r')
data_list = file_obj.readlines()

In [53]:
for line in data_list:
    print line.strip()

Привет! Как дела?
Ничего себе!


Но можно использовать функцию readlines(), которая возвращает список строк нашего файла.

In [54]:
file_obj = open('example.txt', 'r')
file_obj.close()
file_obj.read()

ValueError: I/O operation on closed file

После работы с файлом его нужно закрыть, так как мы должны освободить ресурсы, которые используются системой на чтение и поддержку файла. Кроме этого у нас должны быть безопасная работа с файлом, так как после того как мы его закрыли, мы уже не можем его читать или вносить изменения.

In [61]:
file_obj = open('example_koi.txt', 'r')

In [62]:
print file_obj.read()

������, ��� ����?
����� ����!


In [60]:
import codecs

In [69]:
file_obj = codecs.open('example_koi.txt', 'r', encoding='mbcs')

In [70]:
print file_obj.read()

Привет, как дела?
Ничег себе!


Из-за того, что мы можем работать с файлами в разной кодировке, символы могут отображаться неправильно. Чтобы все отображалось нормально можно использовать библиотеку codecs. В encoding указывается кодировка.

### Запись данных в файл

In [86]:
file_obj = open('file_to_write.txt', 'w')
string = '1234lol\n'
file_obj.write(string)
file_obj.close()

In [87]:
!type file_to_write.txt

1234lol


С помощью функции write записываем нужную строку в файл.

In [88]:
file_obj = open('file_to_write.txt', 'w')
second_string = '1234lol2533\n'
file_obj.write(second_string)
file_obj.close()

In [89]:
!type file_to_write.txt

1234lol2533


Так как мы работаем в режиме write, то содержимое файла будет перезаписываться, так как он уже существует в данной директории.

In [91]:
file_obj = open('file_to_write.txt', 'a')
third_string = '4555wieeweowowkwje\n'
file_obj.write(third_string)
file_obj.close()

In [92]:
!type file_to_write.txt

1234lol2533
4555wieeweowowkwje


Для того чтобы добавить новую строку в конец файла, нужно указать режим append. Если мы хотим записать в файл сразу много строк, то можно записать все эти строки в цикле с помощью write или использовать функцию writelines.

In [93]:
digits = range(1, 11)

In [94]:
digits

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [95]:
with open('second_file_to_write.txt', 'w') as file_obj:
    file_obj.writelines(digit + '\n' for digit in map(str, digits))

In [96]:
!type second_file_to_write.txt

1
2
3
4
5
6
7
8
9
10


При использовании ключевого слова with не нужно беспокоиться о закрытии файла.