Skip to content

Commit

Permalink
Разделил кодирование информации на общие сведения и ASCII
Browse files Browse the repository at this point in the history
  • Loading branch information
chabErch committed Jul 11, 2022
1 parent f484f93 commit ae9a6f3
Show file tree
Hide file tree
Showing 4 changed files with 158 additions and 57 deletions.

This file was deleted.

Original file line number Diff line number Diff line change
@@ -0,0 +1,64 @@
# ASCII

Таблица ASCII (**A**merican Standard **C**ode for **I**nformation **I**nterchange) состоит всего из 256 символов. Каждому символу ставится в соответствие уникальный десятичный код от $0_{10}$ до $255_{10}$ или соответствующий ему двоичный код от $00000000_2$ до $11111111_2$.

Таблицу ASCII содержит 5 частей:

- десятичные цифры;
- символы латинского алфавита;
- управляющие символы;
- символы национального алфавита;
- знаки препинания, скобки и другие символы.

## Десятичные цифры

| десятичный код | шестнадцатеричный код | двоичный код | символ |
| :------------: | :-------------------: | :----------: | :----: |
|||||
| $48$ | $30$ | $00110000$ | 0 |
| $49$ | $31$ | $00110001$ | 1 |
| $50$ | $32$ | $00110010$ | 2 |
|||||
| $57$ | $39$ | $00111001$ | 9 |
|||||

## Символы латинского алфавита


| десятичный код | шестнадцатеричный код | двоичный код | символ |
| :------------: | :-------------------: | :----------: | :----: |
|||||
| $65$ | $41$ | $01000001$ | A |
| $66$ | $42$ | $01000010$ | B |
| $67$ | $43$ | $01000011$ | C |
|||||
| $90$ | $5A$ | $01011010$ | Z |
|||||
| $97$ | $61$ | $01100001$ | a |
| $98$ | $62$ | $01100010$ | b |
| $99$ | $63$ | $01100011$ | c |
|||||
| $122$ | $7A$ | $01111010$ | z |
|||||

## Управляющие символы

| десятичный код | шестнадцатеричный код | двоичный код | символ |
| :------------: | :-------------------: | :----------: | :----: |
|||||


## Знаки препинания, скобки и другие символы

| десятичный код | шестнадцатеричный код | двоичный код | символ |
| :------------: | :-------------------: | :----------: | :----: |
|||||
| $32$ | $20$ | $00100000$ | Пробел |
| $33$ | $21$ | $00100001$ | ! |
| $34$ | $22$ | $00100010$ | " |
| $35$ | $23$ | $00100011$ | # |
|||||
| $58$ | $3A$ | $00111010$ | : |
| $59$ | $3B$ | $00111011$ | ; |
| $60$ | $3C$ | $00111100$ | < |
|||||
Original file line number Diff line number Diff line change
@@ -0,0 +1,91 @@
# Общие сведения о кодировании информации

**Кодирование** — это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите). При этом обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код.

**Декодирование** — обратный переход.

Один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот — несколько символов исходного сообщения заменяются одним символом в новом коде.

Кодирование может быть **равномерное** и **неравномерное**. При равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет однозначное декодирование или даже делает его невозможным.

## Кодирование текстовой информации

С точки зрения компьютера текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа $=$, $($, $\&$ и т.п. и даже пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В компьютер же они попадают в двоичном коде. Это значит, что каждый символ представляется двоичным кодом.

## Таблицы кодировки

**Таблицы кодировки** — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — **код символа**. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка *UTF-8*. Также существуют такие таблицы, как *ASCII*, *UNICODE* и многие другие.

Можно условно выделить несколько составных частей, которые могут присутствовать в таблицах кодировок:

- десятичные цифры;
- символы латинского алфавита;
- управляющие символы;
- символы национального алфавита;
- символы других алфавитов;
- знаки препинания, скобки и другие символы.

### Десятичные цифры

Цифры от $0$ до $9$.

### Символы латинского алфавита

Соответствуют латинскому алфавиту и делятся на *заглавные* и *прописные*.

### Управляющие символы

**Управляющие** — это символы, которым не приписано графическое представление, но которые используются для управления устройствами. Сейчас многие управляющие символы или не используются вообще, или используются не по назначению.

Современные стандарты требуют обязательного наличия лишь восьми управляющих символов — `\0`, `\a`, `\b`, `\t`, `\n`, `\v`, `\f` и `\r`.

#### `\0` или `NUL`

Пустой символ (*NULL*). Этот символ ничего не делает. Некоторые приложения изображают его как пробел, но это неправильно. Часто `\0` используют для обозначения конца цепочки символов. Также может использоваться для передачи данных в случае отсутствия данных.

#### `\a` или `BEL`

Звуковой сигнал (*BELL*). Если этот символ послать на принтер или на терминал, то ничего не напечатается, но послышится звуковой сигнал.

#### `\b` или `BS`

Возврат на шаг (*BACKSPACE*). Перемещает позицию печати на один символ назад. На принтерах может использоваться для наложения одного символа на другой, например `a BS ^ = â`.

#### `\t` или `HT`

Горизонтальная табуляция (*HORIZONTAL TABULATION*). Перемещает позицию печати к следующей позиции горизонтальной табуляции.

#### `\n` или `LF`

Перевод строки (*LINE FEED*). Перемещает позицию печати на одну строку вниз (исходно — без возврата каретки).

#### `\v` или `VT`

Вертикальная табуляция (*VERTICAL TABULATION*). Перемещает позицию печати к следующей позиции вертикальной табуляции.

#### `\f` или `FF`

Прогон страницы, смена страницы (*FORM FEED*). Выбрасывает текущую страницу и начинает печать со следующей.

#### `\r` или `CR`

Возврат каретки (*CARRIAGE RETURN*). Перемещает позицию печати в крайнее левое положение (исходно — без перевода на следующую строку). В Microsoft Windows, для разделения строк используется сочетание кодов возврата каретки `CR` и перевода строки `LF`.

### Символы национального алфавита

Соответствуют кириллическому алфавиту и делятся на *заглавные* и *прописные*.

### Символы других алфавитов

Собственно символы других алфавитов. Как и латинские и кириллические обычно делятся на *заглавные* и *прописные*.

### Знаки препинания, скобки и другие символы

Содержат пунктуационные знаки, скобки, символы для рисования и другие символы.





4 changes: 3 additions & 1 deletion mkdocs.yml
Original file line number Diff line number Diff line change
Expand Up @@ -8,7 +8,9 @@ nav:
- Системы счисления: 'Системы счисления.md'
- Цифровой и аналоговый сигналы: 'Цифра и аналог.md'
- 'Хранение информации':
- Кодирование информации: 'Хранение информации/Кодирование информации.md'
- 'Кодирование информации':
- Общие сведения: 'Хранение информации/Кодирование информации/Кодирование информации.md'
- Таблица ASCII: 'Хранение информации/Кодирование информации/ASCII.md'
- Оптические диски: 'Хранение информации/Оптические диски.md'
- Жесткие диски: 'Хранение информации/Жесткие диски.md'
- 'Что такое Интернет':
Expand Down

0 comments on commit ae9a6f3

Please sign in to comment.