-
Notifications
You must be signed in to change notification settings - Fork 2
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Добавил начало статьи про кодирование информации
- Loading branch information
Showing
3 changed files
with
57 additions
and
0 deletions.
There are no files selected for viewing
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,56 @@ | ||
# Кодирование информации | ||
|
||
**Кодирование** — это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите). При этом обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код. | ||
|
||
**Декодирование** — обратный переход. | ||
|
||
Один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот — несколько символов исходного сообщения заменяются одним символом в новом коде. | ||
|
||
Кодирование может быть **равномерное** и **неравномерное**. При равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет однозначное декодирование или даже делает его невозможным. | ||
|
||
## Кодирование текстовой информации | ||
|
||
С точки зрения компьютера текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа $=$, $($, $\&$ и т.п. и даже пробелы между словами. | ||
|
||
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В компьютер же они попадают в двоичном коде. Это значит, что каждый символ представляется двоичным кодом. | ||
|
||
### Таблицы кодировки | ||
|
||
**Таблицы кодировки** — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — **код символа**. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка UTF-8. Также существуют такие таблицы, как ASCII, UNICODE и многие другие. | ||
|
||
#### ASCII (American Standard Code for Information Interchange) | ||
|
||
Таблица ASCII состоит всего из 256 символов. Каждому символу ставится в соответствие уникальный десятичный код от $0_{10}$ до $255_{10}$ или соответствующий ему двоичный код от $00000000_2$ до $11111111_2$. | ||
|
||
Часть этой таблицы: | ||
|
||
| десятичный код | шестнадцатеричный код | двоичный код | символ | | ||
| :------------: | :-------------------: | :----------: | :----: | | ||
| … | … | … | … | | ||
| $32$ | $20$ | $00100000$ | Пробел | | ||
| $33$ | $21$ | $00100001$ | ! | | ||
| $34$ | $22$ | $00100010$ | " | | ||
| … | … | … | … | | ||
| $48$ | $30$ | $00110000$ | 0 | | ||
| $49$ | $31$ | $00110001$ | 1 | | ||
| $50$ | $32$ | $00110010$ | 2 | | ||
| … | … | … | … | | ||
| $65$ | $41$ | $01000001$ | A | | ||
| $66$ | $42$ | $01000010$ | B | | ||
| $67$ | $43$ | $01000011$ | C | | ||
| … | … | … | … | | ||
| $97$ | $61$ | $01100001$ | a | | ||
| $98$ | $62$ | $01100010$ | b | | ||
| $99$ | $63$ | $01100011$ | c | | ||
| … | … | … | … | | ||
| $192$ | $С0$ | $11000000$ | А | | ||
| $193$ | $С1$ | $11000001$ | Б | | ||
| $194$ | $С2$ | $11000010$ | В | | ||
| … | … | … | … | | ||
| $224$ | $E0$ | $11100000$ | а | | ||
| $225$ | $E1$ | $11100001$ | б | | ||
| $226$ | $E2$ | $11100010$ | в | | ||
| … | … | … | … | | ||
|
||
|
||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters