Skip to content

Commit

Permalink
Добавил начало статьи про кодирование информации
Browse files Browse the repository at this point in the history
  • Loading branch information
chabErch committed Jul 1, 2022
1 parent 2e3a71d commit f484f93
Show file tree
Hide file tree
Showing 3 changed files with 57 additions and 0 deletions.
Binary file added docs/assets/image-20220701141113645.png
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Original file line number Diff line number Diff line change
@@ -0,0 +1,56 @@
# Кодирование информации

**Кодирование** — это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите). При этом обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код.

**Декодирование** — обратный переход.

Один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот — несколько символов исходного сообщения заменяются одним символом в новом коде.

Кодирование может быть **равномерное** и **неравномерное**. При равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет однозначное декодирование или даже делает его невозможным.

## Кодирование текстовой информации

С точки зрения компьютера текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа $=$, $($, $\&$ и т.п. и даже пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В компьютер же они попадают в двоичном коде. Это значит, что каждый символ представляется двоичным кодом.

### Таблицы кодировки

**Таблицы кодировки** — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — **код символа**. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка UTF-8. Также существуют такие таблицы, как ASCII, UNICODE и многие другие.

#### ASCII (American Standard Code for Information Interchange)

Таблица ASCII состоит всего из 256 символов. Каждому символу ставится в соответствие уникальный десятичный код от $0_{10}$ до $255_{10}$ или соответствующий ему двоичный код от $00000000_2$ до $11111111_2$.

Часть этой таблицы:

| десятичный код | шестнадцатеричный код | двоичный код | символ |
| :------------: | :-------------------: | :----------: | :----: |
|||||
| $32$ | $20$ | $00100000$ | Пробел |
| $33$ | $21$ | $00100001$ | ! |
| $34$ | $22$ | $00100010$ | " |
|||||
| $48$ | $30$ | $00110000$ | 0 |
| $49$ | $31$ | $00110001$ | 1 |
| $50$ | $32$ | $00110010$ | 2 |
|||||
| $65$ | $41$ | $01000001$ | A |
| $66$ | $42$ | $01000010$ | B |
| $67$ | $43$ | $01000011$ | C |
|||||
| $97$ | $61$ | $01100001$ | a |
| $98$ | $62$ | $01100010$ | b |
| $99$ | $63$ | $01100011$ | c |
|||||
| $192$ | $С0$ | $11000000$ | А |
| $193$ | $С1$ | $11000001$ | Б |
| $194$ | $С2$ | $11000010$ | В |
|||||
| $224$ | $E0$ | $11100000$ | а |
| $225$ | $E1$ | $11100001$ | б |
| $226$ | $E2$ | $11100010$ | в |
|||||



1 change: 1 addition & 0 deletions mkdocs.yml
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,7 @@ nav:
- Системы счисления: 'Системы счисления.md'
- Цифровой и аналоговый сигналы: 'Цифра и аналог.md'
- 'Хранение информации':
- Кодирование информации: 'Хранение информации/Кодирование информации.md'
- Оптические диски: 'Хранение информации/Оптические диски.md'
- Жесткие диски: 'Хранение информации/Жесткие диски.md'
- 'Что такое Интернет':
Expand Down

0 comments on commit f484f93

Please sign in to comment.