-
Notifications
You must be signed in to change notification settings - Fork 2
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Разделил кодирование информации на общие сведения и ASCII
- Loading branch information
Showing
4 changed files
with
158 additions
and
57 deletions.
There are no files selected for viewing
This file was deleted.
Oops, something went wrong.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,64 @@ | ||
# ASCII | ||
|
||
Таблица ASCII (**A**merican Standard **C**ode for **I**nformation **I**nterchange) состоит всего из 256 символов. Каждому символу ставится в соответствие уникальный десятичный код от $0_{10}$ до $255_{10}$ или соответствующий ему двоичный код от $00000000_2$ до $11111111_2$. | ||
|
||
Таблицу ASCII содержит 5 частей: | ||
|
||
- десятичные цифры; | ||
- символы латинского алфавита; | ||
- управляющие символы; | ||
- символы национального алфавита; | ||
- знаки препинания, скобки и другие символы. | ||
|
||
## Десятичные цифры | ||
|
||
| десятичный код | шестнадцатеричный код | двоичный код | символ | | ||
| :------------: | :-------------------: | :----------: | :----: | | ||
| … | … | … | … | | ||
| $48$ | $30$ | $00110000$ | 0 | | ||
| $49$ | $31$ | $00110001$ | 1 | | ||
| $50$ | $32$ | $00110010$ | 2 | | ||
| … | … | … | … | | ||
| $57$ | $39$ | $00111001$ | 9 | | ||
| … | … | … | … | | ||
|
||
## Символы латинского алфавита | ||
|
||
|
||
| десятичный код | шестнадцатеричный код | двоичный код | символ | | ||
| :------------: | :-------------------: | :----------: | :----: | | ||
| … | … | … | … | | ||
| $65$ | $41$ | $01000001$ | A | | ||
| $66$ | $42$ | $01000010$ | B | | ||
| $67$ | $43$ | $01000011$ | C | | ||
| … | … | … | … | | ||
| $90$ | $5A$ | $01011010$ | Z | | ||
| … | … | … | … | | ||
| $97$ | $61$ | $01100001$ | a | | ||
| $98$ | $62$ | $01100010$ | b | | ||
| $99$ | $63$ | $01100011$ | c | | ||
| … | … | … | … | | ||
| $122$ | $7A$ | $01111010$ | z | | ||
| … | … | … | … | | ||
|
||
## Управляющие символы | ||
|
||
| десятичный код | шестнадцатеричный код | двоичный код | символ | | ||
| :------------: | :-------------------: | :----------: | :----: | | ||
| … | … | … | … | | ||
|
||
|
||
## Знаки препинания, скобки и другие символы | ||
|
||
| десятичный код | шестнадцатеричный код | двоичный код | символ | | ||
| :------------: | :-------------------: | :----------: | :----: | | ||
| … | … | … | … | | ||
| $32$ | $20$ | $00100000$ | Пробел | | ||
| $33$ | $21$ | $00100001$ | ! | | ||
| $34$ | $22$ | $00100010$ | " | | ||
| $35$ | $23$ | $00100011$ | # | | ||
| … | … | … | … | | ||
| $58$ | $3A$ | $00111010$ | : | | ||
| $59$ | $3B$ | $00111011$ | ; | | ||
| $60$ | $3C$ | $00111100$ | < | | ||
| … | … | … | … | |
91 changes: 91 additions & 0 deletions
91
docs/Хранение информации/Кодирование информации/Общие сведения.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,91 @@ | ||
# Общие сведения о кодировании информации | ||
|
||
**Кодирование** — это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите). При этом обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код. | ||
|
||
**Декодирование** — обратный переход. | ||
|
||
Один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот — несколько символов исходного сообщения заменяются одним символом в новом коде. | ||
|
||
Кодирование может быть **равномерное** и **неравномерное**. При равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет однозначное декодирование или даже делает его невозможным. | ||
|
||
## Кодирование текстовой информации | ||
|
||
С точки зрения компьютера текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа $=$, $($, $\&$ и т.п. и даже пробелы между словами. | ||
|
||
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В компьютер же они попадают в двоичном коде. Это значит, что каждый символ представляется двоичным кодом. | ||
|
||
## Таблицы кодировки | ||
|
||
**Таблицы кодировки** — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — **код символа**. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка *UTF-8*. Также существуют такие таблицы, как *ASCII*, *UNICODE* и многие другие. | ||
|
||
Можно условно выделить несколько составных частей, которые могут присутствовать в таблицах кодировок: | ||
|
||
- десятичные цифры; | ||
- символы латинского алфавита; | ||
- управляющие символы; | ||
- символы национального алфавита; | ||
- символы других алфавитов; | ||
- знаки препинания, скобки и другие символы. | ||
|
||
### Десятичные цифры | ||
|
||
Цифры от $0$ до $9$. | ||
|
||
### Символы латинского алфавита | ||
|
||
Соответствуют латинскому алфавиту и делятся на *заглавные* и *прописные*. | ||
|
||
### Управляющие символы | ||
|
||
**Управляющие** — это символы, которым не приписано графическое представление, но которые используются для управления устройствами. Сейчас многие управляющие символы или не используются вообще, или используются не по назначению. | ||
|
||
Современные стандарты требуют обязательного наличия лишь восьми управляющих символов — `\0`, `\a`, `\b`, `\t`, `\n`, `\v`, `\f` и `\r`. | ||
|
||
#### `\0` или `NUL` | ||
|
||
Пустой символ (*NULL*). Этот символ ничего не делает. Некоторые приложения изображают его как пробел, но это неправильно. Часто `\0` используют для обозначения конца цепочки символов. Также может использоваться для передачи данных в случае отсутствия данных. | ||
|
||
#### `\a` или `BEL` | ||
|
||
Звуковой сигнал (*BELL*). Если этот символ послать на принтер или на терминал, то ничего не напечатается, но послышится звуковой сигнал. | ||
|
||
#### `\b` или `BS` | ||
|
||
Возврат на шаг (*BACKSPACE*). Перемещает позицию печати на один символ назад. На принтерах может использоваться для наложения одного символа на другой, например `a BS ^ = â`. | ||
|
||
#### `\t` или `HT` | ||
|
||
Горизонтальная табуляция (*HORIZONTAL TABULATION*). Перемещает позицию печати к следующей позиции горизонтальной табуляции. | ||
|
||
#### `\n` или `LF` | ||
|
||
Перевод строки (*LINE FEED*). Перемещает позицию печати на одну строку вниз (исходно — без возврата каретки). | ||
|
||
#### `\v` или `VT` | ||
|
||
Вертикальная табуляция (*VERTICAL TABULATION*). Перемещает позицию печати к следующей позиции вертикальной табуляции. | ||
|
||
#### `\f` или `FF` | ||
|
||
Прогон страницы, смена страницы (*FORM FEED*). Выбрасывает текущую страницу и начинает печать со следующей. | ||
|
||
#### `\r` или `CR` | ||
|
||
Возврат каретки (*CARRIAGE RETURN*). Перемещает позицию печати в крайнее левое положение (исходно — без перевода на следующую строку). В Microsoft Windows, для разделения строк используется сочетание кодов возврата каретки `CR` и перевода строки `LF`. | ||
|
||
### Символы национального алфавита | ||
|
||
Соответствуют кириллическому алфавиту и делятся на *заглавные* и *прописные*. | ||
|
||
### Символы других алфавитов | ||
|
||
Собственно символы других алфавитов. Как и латинские и кириллические обычно делятся на *заглавные* и *прописные*. | ||
|
||
### Знаки препинания, скобки и другие символы | ||
|
||
Содержат пунктуационные знаки, скобки, символы для рисования и другие символы. | ||
|
||
|
||
|
||
|
||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters