# Строки

https://docs.python.org/3.6/library/strings.html

https://docs.python.org/3.6/library/stdtypes.html#text-sequence-type-str

Строки - константные объекты. Тип строки - str. Строки имеют кодировку utf-8.

In [26]:
s = 'Некоторая строка'
print(s[2:6])
print(s[4:6] * 4)
print(s[:2])
print(s[4:])
print(s[:2] + s[4:])
print(s[1])
print(s[-1])
print(s[:-3])
print(s[-3:])
print(len(s))

кото
тототото
Не
торая строка
Неторая строка
е
а
Некоторая стр
ока
16


In [27]:
"1/3 = " + str(1/3)

'1/3 = 0.3333333333333333'

Строковые литералы:

https://docs.python.org/3.6/reference/lexical_analysis.html#strings

In [28]:
print('двойные "кавычки" внутри одинарных')
print("одинарные 'кавычки' внутри двойных")
print("ещё одинарные \'кавычки\'")
print("склейка " "литералов")
a = "спецсимволы в\n\tстроке"
print(str(a))
print(repr(a))

двойные "кавычки" внутри одинарных
одинарные 'кавычки' внутри двойных
ещё одинарные 'кавычки'
склейка литералов
спецсимволы в
	строке
'спецсимволы в\n\tстроке'


## Функция print

https://docs.python.org/3/library/functions.html#print

https://docs.python.org/3/tutorial/inputoutput.html

In [29]:
print(1, 2, 3)
print(1, 2, 3, sep=", ")
print(1, 2, 3, sep=", ", end="; ")
print(4, 5, 6, sep="", end="")
print("text", sep="" )

1 2 3
1, 2, 3
1, 2, 3; 456text


## Методы str

https://docs.python.org/3.6/library/stdtypes.html#text-sequence-type-str

Метод format

https://docs.python.org/3.6/library/string.html

In [1]:
import math
print('{0} = {1}'.format('math.pi', math.pi))
print('{name} = {value}'.format(name = 'math.pi', value = math.pi))
print('{0} = {1:.2f}'.format('math.pi', math.pi))
a = 2143124
b = 21423
print('{0:10} = {1:10}, {2:10} = {3:10}'.format('a', a, 'b', b))

math.pi = 3.141592653589793
math.pi = 3.141592653589793
math.pi = 3.14
a          =    2143124, b          =      21423


In [16]:
# Форматирование в стиле printf:
print( '%04d' % 3 )
print( '%s %.3f 0x%016X' % ( 1, 1 / 3, 2**100 - 1 ) )
print( ', '.join( ['%X' % i for i in range( 0, 32 )] ) )

0003
1 0.333 0xFFFFFFFFFFFFFFFFFFFFFFFFF
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 1A, 1B, 1C, 1D, 1E, 1F


Разные методы

In [31]:
"SoMe CaPiTaLiZaTiOn".capitalize() # исправление капитализации

'Some capitalization'

In [32]:
# агрессивное устранение капитализации для сравнения строк
"SoMe CaPiTaLiZaTiOn".casefold()

'some capitalization'

In [33]:
s = "Hello world!"
print(s.center(50, "-"))
print(s.ljust(50, "-"))
print(s.rjust(50, "-"))

-------------------Hello world!-------------------
Hello world!--------------------------------------
--------------------------------------Hello world!


In [34]:
"abcaa".count("a")

3

In [35]:
"aaaa".count("aa") # подсчёт неперекрывающихся подстрок

2

In [36]:
"hello world!".find("world")

6

In [37]:
", ".join(["a", "b", "c"])

'a, b, c'

In [38]:
"a, b, c".split()

['a,', 'b,', 'c']

In [39]:
"a, b, c".split(",")

['a', ' b', ' c']

In [40]:
"a, b, c, d".split(",", maxsplit=2)

['a', ' b', ' c, d']

In [41]:
" abc.\n".strip() # аналог нашего Trim

'abc.'

In [42]:
" abc.\n".strip(" \t\r\n.,")

'abc'

In [43]:
"line 1\nline2\n\nline4\n".splitlines()

['line 1', 'line2', '', 'line4']

In [44]:
"line 1\nline2\n\nline4\n".splitlines(True) # keepends

['line 1\n', 'line2\n', '\n', 'line4\n']

In [45]:
"a b c".replace(" ", "_")

'a_b_c'

In [46]:
var,sep,value = "x = 2".partition("=")
print(var.strip(), "is", int(value.strip()))

x is 2


In [47]:
"Hello world!".startswith("Hello")

True

И много ещё всего: https://docs.python.org/3.6/library/stdtypes.html#text-sequence-type-str

In [48]:
for x in range(8):
    for y in range(4):
        print(str(2 ** (x + y * 8)).rjust(12, ' '), end = ' ')
    print()

           1          256        65536     16777216 
           2          512       131072     33554432 
           4         1024       262144     67108864 
           8         2048       524288    134217728 
          16         4096      1048576    268435456 
          32         8192      2097152    536870912 
          64        16384      4194304   1073741824 
         128        32768      8388608   2147483648 


## Массив байт

https://docs.python.org/3/library/stdtypes.html#binary-sequence-types-bytes-bytearray-memoryview

Если нужны именно ASCII-строки, то они описываются типами bytes (константный) и bytearray (неконстантный). У этих типов продублированы методы str.

## Текстовые файлы

In [49]:
with open('Sample.txt', 'w') as file:
    file.write('12345')
with open('Sample.txt', 'r') as file:
    text = file.read()
print(text)

12345


## Модуль string

In [50]:
import string
dir(string)

['Formatter',
 'Template',
 '_ChainMap',
 '_TemplateMetaclass',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_re',
 '_string',
 'ascii_letters',
 'ascii_lowercase',
 'ascii_uppercase',
 'capwords',
 'digits',
 'hexdigits',
 'octdigits',
 'printable',
 'punctuation',
 'whitespace']

In [51]:
string.ascii_letters

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

In [52]:
string.ascii_lowercase

'abcdefghijklmnopqrstuvwxyz'

In [53]:
string.ascii_uppercase

'ABCDEFGHIJKLMNOPQRSTUVWXYZ'

In [54]:
string.digits

'0123456789'

In [55]:
string.hexdigits

'0123456789abcdefABCDEF'

In [56]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [57]:
string.printable

'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~ \t\n\r\x0b\x0c'

In [58]:
string.whitespace

' \t\n\r\x0b\x0c'