Skip to content

Latest commit

 

History

History
1059 lines (759 loc) · 102 KB

syntax.rst

File metadata and controls

1059 lines (759 loc) · 102 KB

cpp

Синтаксис C++

Простейшая программа

Простейшая программа, складывающая два числа, на C++ выглядит так:

#include <iostream>

using namespace std;

int main() {
    int a, b;
    cin >> a >> b;
    int s = a + b;
    cout << s << endl;
    return 0;
}

Давайте разберем ее по строчкам.

#include <iostream>

(Здесь угловые скобки — это просто символы «меньше» и «больше».)

Строчки, начинающиеся с символа #, в C++ называются директивами компилятора (или более точно — директивами препроцессора). В отличие от практически всех других конструкций языка, они обязательно должны быть написаны на отдельной строке.

Директива #include <iostream>, грубо говоря, подключает возможность работы с вводом с клавиатуры и выводом на экран. В первом приближении директива #include в C++ аналогична import в питоне и uses в паскале — она дает вам возможность использовать в программе какие-то дополнительные функции и конструкции.

При этом в C++, в отличие от питона и паскаля, по умолчанию программе доступно очень мало всего. Практически все функции, типы данных и т.д., за исключением очень-очень базового набора, требуют своего #include. В частности, вот даже ввод с клавиатуры, который доступен без всяких import'ов в питоне и без всяких uses в паскале, в C++ требует отдельного #include.

То, что указывается после #include, называется заголовочным файлом. Не надо использовать термин «модуль», который используется в аналогичной ситуации в питоне и паскале; в C++ модули — это совсем другое (и на самом деле доступны только начиная с C++20).

Переходим к следующей строке.

using namespace std;

Эта строка, как говорится, подключает namespace (пространство имён) std. Без нее многие стандартные функции, типы, переменные и т.д. надо было бы писать с префиксом std::, например, писать std::cin вместо cin (cin мы увидим дальше в программе). Команда using namespace не дает вам использовать никакие новые функции (в отличие от #include), она просто меняет способ обращения к уже подключенным функциям.

В серьезных программах на C++ настоятельно не рекомендуется использовать команды using namespace, но в наших небольших программах их вполне можно использовать.

Пока вам не обязательно до конца понимать, что такое пространства имён, пока просто запомните эту команду, ну или прочитайте следующее примечание.

Следующая строка (дальше пойдет уже больше текста по делу и меньше примечаний):

int main() {

Эта строка определяет функцию main, которая не принимает никаких аргументов и возвращает значение типа int (это самый стандартный тип данных для целых чисел). Это эквивалент записи function main:integer в паскале, или def main(): в питоне (только в отличие от питона, на C++ надо явно указывать, какого типа будет возвращаемое значение, в нашем случае это int).

В C++, в отличие от питона, паскаля и многих других языков, нет понятия «основного кода программы», который пишется вне всяких функций. Любой (ну, почти любой) исполняемый код на C++ должен быть частью какой-то функции, и вот самый основной код программы — должен быть написан внутри функции со специальным названием main. Говоря по-другому, при старте программы на C++ автоматически запускается функция с названием main. Она должна быть в любой программе на C++, она должна быть ровно одна, и она должна, как и написано выше, не принимать никаких параметров (хотя на самом деле есть вариант, когда она может принимать определенные параметры — они используются для передачи параметров командной строки, — но это вам пока не будет нужно), и должна возвращать int (про это поговорим ниже).

В целом про синтаксис функций мы тоже поговорим ниже, пока просто запомните, что основной код программы надо начинать с такой строки.

Открывающая фигурная скобка здесь обозначает, что начался код функции. Он будет продолжаться до парной закрывающей фигурной скобки (аналогично begin/end в паскале; в отличие от питона, в C++ отступы не имеют значения для компилятора).

int a, b;

Эта строка объявляет две переменные типа int, переменные будут называться a и b. Напомню, что int — это самый широкоупотребимый тип данных для целых чисел, подробнее про существующие типы данных мы поговорим ниже. Важно отметить, что при такой записи нет никакой гарантии того, что именно будет записано в переменных a и b. В них может оказаться какие угодно значения; в частности, вовсе не гарантируется, что там будут записаны нули. Некоторые компиляторы зануляют все переменные, но другие компиляторы этого не делают. На самом деле использование непроинициализированной переменной в ряде случаев является undefined behavior (см. ниже), т.е. программа в таком случае может себя вести вообще как угодно. Поэтому всегда, если вам важно инициализировать переменные — явно указывайте, чему они должны быть равны (про это ниже). В нашем случае это пока не важно, потому что эти переменные мы будем вводить с клавиатуры.

cin >> a >> b;

Вводим переменные a и b с клавиатуры. Обратите внимание на довольно необычный синтаксис. Переменная cin — это так называемый поток ввода с клавиатуры (от console input), два знака «больше» похожи на стрелочку, указывающую направление движения данных: из cin в a и в b. Так можно вводить любое количество переменных, просто дописываете далее >> и имя переменной.

В C++ ввод с клавиатуры устроен так, что в первом приближении не важно, разделяются числа пробелами или переводами строк. Запись как написано выше считает число с клавиатуры, пропустив сначала лишние пробелы или переводы строк, если они там будут, и потом считает еще одно число, опять же пропустив пробелы и переводы строк перед ним.

int s = a + b;

Заводим новую переменную, s, тоже типа int, и сразу в нее записываем сумму чисел a и b. Вот так можно сразу при создании переменной записывать в нее нужное значение. Справа от знака =, конечно, может быть любое выражение, в том числе и просто число, если мы сразу знаем, какое число нам нужно (т.е. можно, например, написать int cnt = 0;, если мы хотим в переменную записать ноль).

Вообще, в C++ рекомендуется все переменные сразу при создании инициализировать, за исключением особых случаев типа ввода с клавиатуры. В частности, поэтому рекомендуется создавать переменные лишь в тот момент, когда они уже вам понадобились. Люди, переходящие с паскаля, любят объявлять все нужные переменные сразу в начале функции — так делать не надо. Объявляйте каждую переменную только когда она уже понадобилась; например, здесь мы объявляем переменную s только когда она нам уже стала нужна. Заодно часто в таких ситуациях мы сразу можем записать осмысленное значение в переменную, а если бы объявляли бы в начале функции, то это было бы невозможно (в нашем примере — если бы мы объявляли бы переменную s в начале функции, то мы не могли бы сначала записать туда ничего осмысленного).

cout << s << endl;

Выводим ответ на экран. Здесь cout — это переменная, отвечающая за вывод на экран (console output), и на этот раз используются символы «меньше», тоже явно указывая направление движения данных: из s в cout. Далее выводим endl — это специальная переменная, вывод которой в cout приводит к переводу строки. (На самом деле, как я буду писать ниже, не стоит пользоваться endl, он довольно тормозит. Но для начала, и вообще в программах, где объем выходных данных не очень большой, endl вполне можно писать.) (Также отмечу, что в данной конкретной программе перевод строки особо не нужен, т.к. мы и так не собираемся больше никаких данных выводить. Если бы нам было надо дальше выводить что-то еще, то да, перевод строки мог бы иметь смысл, а так он не особо нужен.)

return 0;

Как и в других языках, команда return обозначает завершить работу функции и вернуть в место вызова указанное значение. Но тут мы находится в главной функции, main, поэтому эта команда завершает выполнение программы.

А ноль тут становится кодом возврата (exit code) всей программы. Вообще, есть общепринятое соглашение во всех операционных системах, что каждая запускаемая программа возвращает операционной системе специальное число — так называемый код возврата, — который указывает, успешно ли завершилась программа или нет, так, чтобы тот, кто запускал эту программу (сама ОС или какие-либо еще программы) мог понять, был ли вызов успешным. Тоже по общепринятому соглашению, код возврата, равный нулю, обозначает, что программа успешно завершилась, ненулевой же код обозначает, что произошла какая-то ошибка.

Например, Code::Blocks пишет код возврата — exit code — в окошке программы после ее завершения. Аналогично, тестирующие системы анализируют код возврата вашей программы и, если он не ноль, то выставляют результат теста «ошибка времени выполнения», ну или «ненулевой код возврата» (это одно и то же).

Вот команда return в функции main в C++ как раз и указывает, какой код возврата должна вернуть ваша программа. Мы пишем return 0: это обозначает, что программа успешно завершилась. Мы могли бы написать, например, return 1, и тогда бы тот, кто запускал программу, мог бы понять, что что-то пошло не так. В частности, если на каком-то тесте в тестирующей системе у вас main заканчивается с return 1, то вы скорее всего получите результат теста типа «ошибка времени выполнения» или «ненулевой код возврата».

В других языках программирования концепция кода возврата, конечно, тоже есть, просто в питоне и паскале, например, считается, что если выполнение успешно дошло до конца основного кода, то код возврата будет ноль. Но вы наверняка встречали необходимость явно указать код возврата — например, в конструкции sys.exit(0) ноль — это как раз код возврата, с которым надо завершить программу.

И как раз именно поэтому функция main должна возвращать тип int, поэтому заголовок функции выглядит как int main() {.

}

Ну и наконец последняя строка программы — закрывающая фигурная скобка, показывающая, что код функции main закончился. Это аналогично паскалевскому end.

Основные принципы синтаксиса

Программа на C++ — это (как и в других языках) последовательность команд. Большинство команд должны заканчиваться точкой с запятой.

Структура программы формируется фигурными скобками, т.е. блоки функций, блоки if'ов, циклов и т.п. указываются с помощью фигурных скобок. В отличие от питона, отступы в программе на C++ не имеют никакого значения для компилятора. С точки зрения компилятора можно ставить отступы как хотите, и вообще разбивать программу на строки как хотите и т.д. (Есть некоторые исключения, типа директив компилятора, см. выше, и однострочных комментариев, см. ниже.) Тем не менее, конечно, рекомендуется ставить отступы аналогично тому, как они ставятся в питоне (ну и на самом деле в любом другом языке программирования) — чтобы программу было удобнее читать.

Комментарии в C++ бывают двух типов: однострочные — они начинаются с двух слешей подряд (//) и длятся до конца строки, и многострочные — начинаются с /* и идут до */. Например:

#include <iostream>

using namespace std;

int main() {
    int a, b;  // это комментарий
    cin >> a >> b;  /* и
    это
    тоже
    комментарий */ int s = a + b;
    cout << s << endl;
    return 0;
}

Язык C++ чувствителен к регистру (как и питон, и в отличие от паскаля): заглавные и маленькие буквы различаются. В простейших программах принято использовать только маленькие буквы. Большие буквы обычно используются в типах (именах классов) и в названиях глобальных констант и макросов, в наших программах вам такое редко будет нужно.

Переменные определяются в основном внутри функций, но также можно определить и глобальные переменные — их надо определять вне всех функций:

#include <iostream>

using namespace std;

int a, b;

int main() {
    cin >> a >> b;  // тут теперь используются глобальные a и b
    int s = a + b;
    cout << s << endl;
    return 0;
}

Глобальные переменные будут видны во всех функциях, определенных ниже (по коду программы) самих переменных. Вообще, глобальные переменные не рекомендуется использовать, но в простых программах вы можете их использовать, если они действительно нужны в разных функциях (например, если вы пишете поиск в глубину, то можно граф сделать глобальной переменной).

Целочисленные типы данных и переполнения

В отличие от питона, в котором тип для целых чисел один и он может хранить сколько угодно большие числа (переходя на длинную арифметику при необходимости), в C++ есть очень много разных типов для целых чисел, и у каждого свои границы допустимого интервала значений. При этом типы жестко не определены; допустимый интервал у одного типа может быть разный в разных компиляторах или даже при разных опциях одного компилятора.

Я не буду перечислять тут все типы, их очень много, перечислю только основные, которые вы будете использовать:

  • int — основной, наиболее широкоупотребимый тип. Хранит числа от  − 231 до 231 − 1, либо (в зависимости от компилятора и опций) от  − 263 до 263 − 1, занимает соответственно 4 или 8 байт.
  • unsigned int (так и пишется, с пробелом!), или сокращенно unsignedбеззнаковый (т.е. не хранит знак числа, а вместо него хранит дополнительный бит значения числа) аналог int, хранит числа от 0 до 232 − 1 или до 264 − 1, занимает соответственно 4 или 8 байт (столько же, сколько и int).
  • long long int, или сокращенно long long — хранит числа от  − 263 до 263 − 1, занимает 8 байт.
  • unsigned long long int, или сокращенно unsigned long long — беззнаковый аналог long long'а, хранит числа от 0 до 264 − 1, занимает 8 байт.
  • size_t — это беззнаковый тип, достаточно большой настолько, что гарантируется, что размер (в байтах) любого допустимого типа данных (в том числе массивов) точно влезет в этот тип (это не совсем точное определение, но близко к смыслу). То есть size_t гарантированно позволяет хранить количество байт, которое занимает любая другая переменная. Как правило, это или эквивалент unsigned, или эквивалент unsigned long long. Он часто используется в ситуациях, когда какие-то стандартные функции возвращают размер какого-либо объекта, количество элементов в массиве или т.п. (потому что, в силу определения выше, этот размер точно влезет в size_t, а вот в int, к примеру, может и не влезть). В простейших случаях вы не будете сами этот тип использовать, но будете его встречать в описаниях стандартных функций.

Важной особенностью целочисленных типов в C++ (да и вообще практически в любом другом языке, но не в питоне) являются переполнения. Если вы попытаетесь сохранить в переменную значение за пределами допустимого диапазона ее типа, то вместо этого сохранится какое-то другое значение, принадлежащее допустимому диапазону. При этом в C++ не возникнет никакой ошибки, просто молча получится неправильный ответ.

Слово «сохранить» в предыдущем абзаце относится как к ситуациям, когда вы напрямую попробовали написать такое число (например, int x = 12345678901234567890;), так и к ситуациям, когда вы сохраняете результат каких-либо вычислений (int a = 1000000000; int b = a * a;), и к ситуациям ввода данных и т.д. Попробуйте поэкспериментировать и посмотреть, как это работает.

Поэтому всегда, когда работаете с целочисленными типами данных, помните про опасность переполнения. Всегда оценивайте, какое максимальное значение может получиться в той или иной переменной, и проверяйте, влезет ли оно в тип. Если не влезает в 4-байтный int, то лучше сделайте переменную long long (вообще говоря, никто не мешает вообще все переменные делать long long, но тогда вы рискуете, что какие-то большие массивы не пройдут по ограничению памяти, плюс long long тоже может переполниться). Если вы видите, что ответ не влезает даже в long long, то тут уже надо думать. Возможно, в конкретном компиляторе есть 16-байтовый целочисленный тип (типа int128_t или __int128), но это далеко не всегда так, ну и он тоже может переполниться. Или вам надо использовать длинную арифметику. Или придумать другой алгоритм, в котором не будут возникать такие большие числа.

Частым и очень ярким признаком переполнения знаковых типов (int и long long) является то, что ответ, который не может быть отрицательным (например, сумма положительных чисел), все-таки оказывается отрицательным. Если вы такое заметили в своей программе — точно ищите переполнение.

Кроме того, я не рекомендую вам использовать unsigned-типы без нужды. В них очень частая ошибка — так называемое underflow, переполнение вниз: например, если вы попытаетесь из 0 вычесть 1, то получится не -1 (потому что unsigned-типы не могут хранить отрицательные числа), а очень большое число. В частности, характерная ошибка — вычесть единицу из длины какого-нибудь массива или строки: поскольку эти длины обычно измеряются в size_t, то при нулевой длине строки получится переполнение. Правильно сначала сохранить длину в int, а потом уже вычитать 1, ну или привести типы, см. ниже.

Еще скажу про так называемые приведения типов (от слова «приводить» — вы один тип приводите к другому, т.е. конвертируете в другой тип; также говорят «кастовать» от английского cast). Вы всегда можете сконвертировать тип значения, просто сохранив его в переменную нового типа:

unsigned x = ....;
int y = x;  // был x unsigned, а мы сохранили в int
cout << y - 1;  // теперь можно вычитать 1, не боясь, что будет переполнение

Но чтобы не заводить лишних переменных, можно просто написать выражение, которое будет иметь нужный тип. Полный вид записи в стиле C++ такой: static_cast<int>(x), тут в угловых скобках (опять-таки, это просто символы меньше-больше) указываете, какой тип вы хотите получить, а в круглых скобках — значение какой переменной хотите скастовать. Эта запись — это выражение, т.е. ее можно куда-нибудь сохранить или использовать в других выражениях. Например, так:

unsigned x = ...;
cout << static_cast<int>(x) - 1;  // сначала привели к int, потом вычли 1

Есть еще и запись в стиле C: (int)x, например

unsigned x = ...;
cout << (int)x - 1;  // сначала привели к int, потом вычли 1

В первом приближении это то же самое, но со сложными типами лучше использовать static_cast.

Естественно, static_cast касается не только целочисленных типов, можно указывать разные типы, например вещественный тип: static_cast<double>(x) (при тип double см. ниже). Строгие правила, какие типы к какому можно приводить, довольно сложные и в целом довольно строгие (например, сконвертировать число в строку или наоборот через static_cast не получится), но можете поэкспериментировать.

Арифметические операции

Сложение, вычитание и умножение делаются также, как и в других языках, через +, - и *, тут ничего особенного. Специального оператора для возведения в степень нет, пишите цикл :) (ну или быстрое возведение в степень, или pow, в зависимости от ситуации).

А вот с делением есть особенности. Неполное частное берется оператором /, остаток берется оператором %, но при этом нет прямого способа разделить два целых числа так, чтобы получилось вещественное (т.е. в C++ / — это питоновский //, а аналога питоновскому / нет). Чтобы получить вещественное деление, вам надо явно сделать так, чтобы хотя бы одно из чисел было вещественное.

Например:

int x = 10, y = 3;
cout << x / y;  // выведет 3
cout << 1.0 * x / y;  // сделали числитель вещественным, выведет 3.33333

Частный, но очень важный случай — запись 1/2 дает ноль. Чтобы получить 0.5, надо написать, например, 1.0/2 (ну или напрямую 0.5, конечно).

Вторая особенность деления состоит в обработке отрицательных чисел. Если вы берете остаток от деления отрицательного числа на положительное, то остаток будет отрицательным. Это может казаться логичным, может казаться нелогичным (и на самом деле это нелогично), но в питоне это не так, и во многих случаях вам будет мешать. Стандартный способ обойти эту проблему — написать (a%b+b)%b, т.е. после одного взятия остатка прибавить b (чтобы получилось уж точно положительное число) и взять остаток еще раз. Ну или написать if. Аналогично при вычислении неполного частного от деления отрицательного числа на положительное ответ может отличаться на 1 от того, что вы ожидаете.

А если знаменатель отрицательный, то там все еще сложнее может быть.

Присваивания, auto и ++

Присваивание делается одиночным равенством:

s = a + b;

(Это подразумевает, что у вас уже есть переменная s, куда вы просто хотите записать новое значение.)

Также есть сокращенные операторы присваивания как в питоне: +=, -=, *=, /=, %=.

Мы также видели, что присваивания можно использовать сразу при объявлении переменной:

int a = 10;

В таком случае также вместо конкретного типа можно использовать специальное слово auto, которое обозначает «используй тот тип, который в правой части выражения» (это появилось только в C++11):

int a, b;
...
auto c = a + b;  // тип выражения a+b — int, поэтому переменная c получается тоже int

Запись auto a = 10 не очень понятна (какого типа 10 — int? unsigned? long long?..), поэтому ее не надо использовать. А вот если справа сложное выражение, то вполне можно использовать auto.

Есть также специальные конструкции ++ и --, которые обозначают увеличить или уменьшить переменную на 1:

int a = 10;
a++;  // увеличить a на 1, получается a == 11
a--;  // уменьшить на 1, получается обратно 10

На самом деле, тут есть два варианта записи этих операторов: a++ и ++a, и аналогично с --. Оба увеличивают a на единицу, но отличаются возвращаемым значением, т.е. значением самого выражения (которое используется, если вы написали типа b = a++ или например вызываете функцию: foo(a++)). При записи a++ возвращаемое значение будет равно старому значению a (типа сначала запомни значение a, потом увеличь его на 1), при ++a — новому (типа сначала увеличь, потом используй значение a), и аналогично с --:

int a = 10;
int b = a++;  // b получается 10
int c = --a;  // с тоже получается 10

Но вообще использовать результат операторов ++ и -- — это плохая практика, не делайте так. Пишите a++ отдельной командой, и тогда проблем не будет.

Квадратный корень вычисляется через sqrt, для него надо подключить заголовочный файл cmath (#include <cmath>). Модуль вычисляется через abs.

Ввод-вывод

Как мы уже видели, ввод с клавиатуры осуществляется через объект cin, вывод на экран — через cout:

#include <iostream>

.....

int a, b;
cin >> a >> b;
cout << a + b;

При этом такое считывание автоматом пропускает лишние пробелы и переходит на новые строки, поэтому не важно, находятся два числа в одной строке или в разных. Если же вам это важно (например, надо считать данные только с одной строки), то это сложнее, проще всего использовать stringstream, см. ниже в разделе про строки.

Перевод строки при выводе осуществляется записью endl, или можно вывести специальный символ или строку '\n' или "\n" (в данном случае не важно, кавычки или апострофы, но в целом про строки и символы см. ниже).

Обратите внимание, что cout не вставляет пробелы между переменными (в отличие от питоновского print). Вставляйте их сами где надо. Также обратите внимание, что вам не надо писать никакой специальной конвертации введенных данных в целом число (в отличие от питоновского int()). Вы уже объявили переменную как int, этого достаточно.

Выше описан ввод-вывод «в стиле C++». В стиле C ввод-вывод делается через функции printf и scanf. Я не буду их описывать, они заметно сложнее, просто не удивляйтесь, если где-то их увидите.

Условный оператор (if) и логические операции

Записывается так:

if (условие) {
    код
} else {
    код
}

Часть else, конечно, может быть опущена:

if (условие) {
    код
}

Важно тут следующее. Во-первых, условие обязательно заключается в круглые скобки. Во-вторых, сам код заключается в фигурные скобки; именно они определяют, какой код находится внутри if'а. Исключение — если в if только одна команда, то можно фигурные скобки не писать. Но это не рекомендуется делать, за исключением ситуаций, когда команда очень простая.

В условии, как и в питоне, можно использовать сравнения (>, >=, <, <=, ==, !=), обратите внимание, что сравнение делается двойным равенством (собственно, как и в питоне, и в отличие от паскаля).

Важный момент тут — что C++ не выдает ошибку, если вы напишете одиночное равенство, а не двойное:

if (a = b) {...}

но это уже вовсе не сравнение, это присваивание! и поэтому работает совсем не так, как вы можете думать. Это очень частая ошибка, особенно у тех, кто переходит с паскаля. Питон в такой ситуации выдает ошибку, а вот C++ — нет.

Логические операции записываются так: and — &&, or — ||, not — !. Пример:

if ((year % 400 == 0) || (year % 4 == 0 && !(year % 100 == 0)))

(конечно, можно было и просто написать year % 100 != 0).

Конструкции elif в C++ нет. Но она и не нужна — вы прекрасно можете просто писать else if:

if (...) {
    ...
} else if (...) {
    ...
} else if (...) {
    ...
} else {
    ...
}

На питоне вы бы не смогли так написать, потому что каждый else/if требовал бы увеличить отступ, и получились бы отступы ступенькой. Но на C++ строгих требований на отступы нет, поэтому вполне можно прямо так писать.

Циклы

Цикл while пишется так, как вы, наверное, уже ожидаете:

while (условие) {
    код
}

Как и в if, тут обязательно брать условие в скобки, и тело цикла заключается в фигурные скобки, исключение — если тело цикла состоит из одной команды, скобки можно не ставить (но все равно рекомендуется). Работает цикл while так же, как и в других языках.

А вот цикл for в C++ пишется и работает довольно необычно. В простейшем случае он пишется так:

for (int i = 0; i < n; i++) {
    код
}

это эквивалент питоновского for i in range(n): — переменная i пробегает все значения от 0 включительно до n невключительно.

В общем виде в заголовке for есть три части, разделенные точкой с запятой. Первая часть (int i = 0 в примере выше) — что надо сделать перед циклом (в данном случае — объявить переменную i и записать туда ноль). Вторая часть (i < n) — условие продолжения цикла: это условие будет проверяться перед самой первой итерацией цикла и после каждой итерации, и как только условие станет ложным, выполнение цикла закончится (аналогично условию while). И третья часть (i++) — что надо делать после каждой итерации до проверки условия.

То есть запись выше обозначает: заведи переменную i, запиши туда ноль, дальше проверь, правда ли, что i<n и если да, то выполняй тело цикла, потом делай i++, опять проверяй i<n, если все еще выполняется, то опять выполняй код и делай i++, и т.д., до тех пор, пока в очередной момент не окажется i>=n.

Примеры:

for (int i = n - 1; i >= 0; i--)  // цикл в обратном порядке
for (int i = 0; i < n; i+= 2)  // цикл с шагом 2
for (int i = 0; !found && i < n; i++)  // цикл закончится когда found станет true, или i >= n
for (int i = 1; i < n; i *= 2)  // цикл по степеням двойки

То есть на самом деле for в C++ — очень мощный вид цикла, такой, что даже обычный while является частный случаем for (потому что в for можно просто опустить ненужные части заголовка: for (; условие;) полностью эквивалентно while (условие)). Но настоятельно рекомендуется использовать for только в тех ситуациях, когда у вас есть явная «переменная цикла», которая как-то последовательно меняется, и тогда в заголовке for вы упоминаете только ее. Если вам надо что-то сложнее, пишите while.

Обратите также внимание, что переменную цикла принято объявлять прямо в заголовке цикла. В частности, такая переменная не будет видна снаружи цикла — ну и правильно, если вы пишете цикл for, нечего использовать переменную цикла после цикла. И заодно это позволяет например написать два цикла for подряд с одной и той же переменной, причем эти переменные не обязаны иметь одинаковый тип:

for (int i = 0; i < n; i++) {
    код, тут i -- int
}
// тут переменной i нет вообще
for (unsigned int i = 1; i < m; i *= 2) {
    код, тут i -- unsigned
}

Есть еще одна форма цикла for, которая появилась в C++11 — это так называемый range-based for. Это уже чистый аналог питоновского for ... in, который позволяет итерироваться не по range, а по более-менее любому объекту (массиву, строке и т.п.). На C++ это пишется так:

for (int i : v) {
    код
}

здесь предполагается, что v — это массив int'ов, и тогда i последовательно принимает все значения элементов этого массива.

В частности, тут часто удобно использовать auto:

for (auto i : v) {
    ...
}

у переменной i получится такой же тип, как у элементов массива.

Команды break и continue есть и работают в точности так же, как в питоне и паскале; в частности, можно писать while (true) и далее в коде использовать break.

Кроме того, есть еще цикл do-while с проверкой условия после итерации, я его не буду описывать (хотя там ничего сложного), он бывает довольно редко нужен (точнее даже практически никогда, не случайно в питоне нет его эквивалента).

Массивы

Массивы в C++ объявляются следующим образом:

#include <vector>

....
vector<int> v;

Это объявляет пустой (длины ноль) массив (также часто говорят «вектор», по названию типа), в котором будут храниться int'ы. В угловых скобках можно написать и другой тип — соответственно, будет массив элементов соответствующего типа. В частности, двумерный массив делается так: vector<vector<int>> — это массив, каждый элемент которого является массивом int'ов.

(Конструкция >> в записи vector<vector<int>> — это особенность C++11. В более ранних стандартах запись >> однозначно воспринималась как оператор ввода данных, и для определения двумерного массива надо было писать vector<vector<int> > с пробелом.)

Можно сразу указать длину массива:

vector<int> v(n);

это массив длины n. Он на самом деле будет заполнен нулями, но лучше на это не полагаться, указывайте ноль явно (потому что есть ряд схожих конструкций, когда данные остаются не инициализированы). Чтобы явно указать, каким значением заполнить массив, это значение надо указать после длины:

vector<int> v(n, 1);

это массив, заполненный единицами.

Также можно создать массив, явно перечислив его элементы в фигурных скобках:

vector<int> v{-1, 0, 1};

— это массив длины 3 с элементами -1, 0, 1.

Двумерный массив, заполненный нулями, создается так:

vector<vector<int>> v(n, vector<int>(m, 0));

Что здесь написано? Начало понятное: vector<vector<int>> v(n, — это массив массивов, длина внешнего массива равна n. А дальше написано, чему должен быть равен каждый элемент: vector<int>(m, 0) — это можно сказать безымянный массив длины m, заполненный нулями. Поскольку он указан как значение для элементов внешнего массива, то этот массив длины m раскопируют и заполнят им внешний массив длины n. Итого получается двумерный массив n x m, заполненный нулями.

Аналогично можно создавать и многомерные массивы. Только в отличие от питона, в C++ все элементы одного массива должны иметь один тип, нельзя сделать массив, в котором часть элементов будет числами, а часть массивами, и т.п. (Но на самом деле обычно вам это и не нужно.)

Доступ к элементам массива осуществляется через квадратные скобки: v[i], для двумерного массива v[i][j] (тем, кто переходит с паскаля: обратите внимание, что запись v[i,j] скомпилируется, но работать будет совсем не так, как вы хотите). Элементы массива индексируются начиная с нуля, как в питоне. Отрицательной индексации, как в питоне, нет: запись v[-1] — это выход за пределы массива.

Выход за пределы массива в C++ не обязательно приводит к ошибке. Строго говоря, он может привести к чему угодно, в простейших случаях будет выполняться просто работа с памятью за пределами массива, возможно, будут затерты какие-то другие нужные вам данные и т.п., если вы очень сильно вышли за пределы массива, то программа вылетит. Но строго говоря при выходе за пределы массива может произойти абсолютно что угодно, это называется undefined behavior, см. про это ниже.

На массивах доступно немного меньше операций, чем в питоне. Основное — это операции push_back (приписывает элемент к концу массива, аналог питоновского append, пишется v.push_back(x);) и pop_back (удаляет последний элемент массива: v.pop_back();). Также работает присваивание массивов (v2 = v;), причем, в отличие от питона, при этом происходит реальное копирование массива: после этого v2 и v — разные массивы, и изменения в одном не влияют на изменения в другом. Также массивы можно сравнивать любыми операторами сравнения (>, < и т.д., в том числе ==). Оператор == проверяет, правда ли, что два массива одинаковы, т.е. поэлементно равны; операторы сравнения больше-меньше сравнивают массивы лексикографически. Длину массива можно узнать через v.size().

Есть также много других операций, но не надо их использовать, по крайней мере пока вы не понимаете, какая у них сложность.

Вводить и выводить массивы напрямую через >> и << нельзя, надо всегда писать цикл (но за счет потокового ввода, т.е. за счет того, что оператору >> все равно, разделяются числа пробелами или переводами строки, ввод массива пишется довольно просто, особенно если вам заранее задано, сколько в массиве будет элементов).

Типичный пример: если вам сначала вводится количество элементов в массиве, а потом сам массив, то это можно писать так:

int n;
cin >> n;
vector v(n);
for (int i = 0; i < n; i++) {
    cin >> v[i];
}

Обратите внимание, что мы объявляем переменную v только тогда, когда она понадобилась, и за счет этого можем сразу указать нужную длину массива. Конкретные значения элементам массива в момент объявления переменной не указываем, потому что все равно будем их вводить с клавиатуры.

Прямого аналога питоновских срезов нет.

Помимо векторов (vector), существуют также так называемые сырые массивы. Они объявляются так:

int a[10];
// или
int* a = new int[10];

Это массивы в стиле C; не надо их использовать.

Символы и строки

Символьный тип данных в C++ называется char, символьные константы пишутся в одиночных апострофах (не кавычках!).

Довольно необычная особенность char — в отличие от питона и паскаля, в C++ char — это сразу целочисленный тип, с точки зрения компилятора он хранит целое число. В C++ нет операций типа ord и char, переводящих символ в его код и наоборот. В C++ символ и его код — это одно и то же. Вы можете записать в переменную символ, а потом прибавить какое-нибудь число, или например вы можете вычесть два символа.

Примеры:

char a = 'A';  // ок, все понятно, это так же, как в питоне и паскале
a += 10;  // мы можем к char прибавить 10, это дает символ, чей код на 10 больше чем 'A'
int diff = 'a' - 'A';  // мы можем вычитать два символа и получать int (а можно и char)
char b = 'B';
b += diff;  // получается 'b'
int x = b;  // просто копируем значение в x — теперь в x код символа 'b'
char z = '9';
int value = z - '0';  // так можно из символа-цифры получить настоящее значение этой цифры

Говоря по-другому, символы в C++ — это просто другая запись чисел. Т.е. запись 'A' и 65 — это практически одно и то же.

Единственное отличие char от других целочисленных типов — это ввод-вывод. При вводе и выводе переменных типа char выводятся соответствующие символы. Во всем остальном переменные типа char ведут себя как числа, равные коду соответствующих символов.

В частности, символы можно сравнивать через больше/меньше; поскольку символы — это числа, то сравнение выполняется совершенно естественно. Символы можно использовать как индексы массивов (типа v['$']), по ним можно делать циклы (for (char ch = 'a'; ch <= 'z'; ch++)) и т.д.

Но есть одна важная особенность типа char — это то, что он по умолчанию знаковый, signed, т.е. может хранить и отрицательные числа. Его диапазон по умолчанию от -128 до 127. Получается, что символы из первой половины ascii-таблицы имеют корректные положительные коды, а символы из второй половины — отрицательные. Это нередко может мешать, но легко решается работой с unsigned char. Вы можете просто скопировать значение в unsigned char:

char x;
cin >> x;
unsigned char xx = x;  // теперь xx содержит верный код от 0 до 255

или можете воспользоваться приведением типов, т.е. явно сконвертировать в unsigned char:

char x;
cin >> x;
v[static_cast<unsigned char>(x)] = ...
// ну или вариант в стиле C
v[(unsigned char)x] = ...

Строки хранятся в переменных типа string, строковые константы задаются в кавычках (не в апострофах!), для экранирования символов (кавычек и т.п.) используется обратный слеш:

#include <string>

...
string s = "Test";
string s2 = "Quote: \", slash: \\";

Как и в других языках, строка — это массив, элементами которого являются символы, соответственно, со строкой доступны те же операции, что и с массивом: size, push_back, pop_back, получение элемента по индексу через квадратные скобки. Кроме того, есть метод length, который эквивалентен size (т.е. можно писать s.size(), а можно s.length()), доступно сложение строк (s1 + s2 — это строка s1, к которой приписана строка s2).

В отличие от числовых переменных, если не проинициализировать string, она автоматически проинициализируется пустой строкой.

Отдельно скажу про ввод-вывод. Вывод осуществляется обычным cout << .... Ввод можно делать через cin >> ..., но он тогда считывает строку до первого пробела (или перевода строки). Чтобы считать полную строку до перевода строки, надо писать getline(cin, s);.

Конвертация числа в строку делается командой to_string, например, string s = to_string(x);. Конвертация обратно делается функциями stoi (string-to-int), или stoll (string-to-long-long), в зависимости от требуемого типа на выходе.

Еще отдельно скажу про полезный тип данных istringstream (input string stream). Он позволяет превратить любую строку в «поток ввода», аналогичный cin, и дальше «считывать» из нее числа и прочие данные через >>. Пишется так:

#include <sstream>

...

string s = "12 13";
istringstream ss(s);
int a, b;
ss >> a >> b;  // получается a == 12, b == 13

Он особо полезен, когда вам надо считать числа «до конца строки». Вот так, например, можно одну строку входных данных превратить в массив чисел:

string s;
getline(cin, s);
istringstream ss(s);
vector<int> v;
int x;
while (ss >> x) {
    v.push_back(x);
}

Здесь из незнакомых конструкций — только применение оператора ввода >> внутри while. Дело в том, что любую операцию ввода можно использовать в условии — это получается проверка того, был ли ввод успешным. Соответственно, цикл работает «пока получается считать число из ss». Цикл остановится, когда в ss не будет больше чисел.

Есть симметричный тип ostringstream (output string stream), в который можно выводить данные через <<, а потом сконвертировать его в строку. Но я подробно писать про него не буду, он намного реже нужен.

Наконец, отмечу, что как массивы, так и строки существуют в варианте C++ и существуют в варианте C. В стиле C для строки используется «сырой массив» символов (char'ов), который обычно обозначается char* или char[]. Не надо его использовать в ваших программах.

Вещественные числа

Напомню, что в целом современные процессоры поддерживают три типа вещественных чисел<pythonBasicsFloatTypes>:

  • single — хранит 7-8 цифр мантиссы, экспоненту до примерно ±40, занимает в памяти 4 байта, работает сравнительно быстро;
  • double — хранит 15-16 цифр мантиссы, экспонента до примерно ±300, занимает 8 байт, работает несколько медленнее;
  • extended — хранит 19-20 цифр мантиссы, экспонента до примерно ±5000, занимает в памяти 10 байт, работает намного медленнее;

В C++ доступны типы single (называется float), double (так и называется double), а также есть тип long double, который в зависимости от компилятора может быть или double, или extended.

В большинстве наших программ стоит использовать тип double или long double; у типа float в наших задачах обычно не хватает точности. Обратите, в частности, внимание, что в питоне float — это double, а в C++ float — это single.

Ввод-вывод также работает через cin/cout, только надо иметь в виду, что cout по умолчанию округляет число до шести значащих цифр. Нередко нам этого недостаточно, тогда надо просто в начале программы например, например, cout.precision(20); — это потребует выводить 20 значащих цифр. Это, конечно, много и даже слишком много, но хуже не будет, и лучше так, чем потерять точность при выводе.

Есть функции ceil, floor, trunc и round с тем же смыслом, что и в питоне; для их использования надо подключить заголовочный файл cmath (#include <cmath>). Для взятия модуля (abs) тоже надо подключать cmath, иначе могут быть разные неожиданности.

Все соображения про точность работы с вещественными числами и про eps, описанные в соответствующем разделе текста про питон<pythonBasicsFloat>, справедливы и для C++.

Логический тип данных

Логический тип данных называется bool и может принимать два значения: true и false (с маленькой буквы). Как и в других языках, в переменную типа bool можно записывать напрямую результаты сравнений и других условий; и переменную типа bool можно использовать напрямую в if'ах, while'ах и т.п.

Функции

Функция в общем виде определяется так:

int foo(int x, double y, string s) {
    ...
}

Это определена функция foo, которая принимает три параметра: x типа int, y типа double и s типа string, и возвращает тип int. Если аргументов нет, то надо обязательно написать пустые скобки: int foo() {...}. Внутри функции для завершения функции и возврата значения используется команда return <значение>.

Любая ветка исполнения функции обязана завершаться командой return <значение>, ее отсутствие — это undefined behavior (см. ниже), т.е. в случае ее отсутствия программа может вести себя вообще как угодно. (Исключение — функции, возвращающие void, см. ниже.)

Особый случай — функции, не возвращающие ничего («процедуры», если пользоваться терминами паскаля). Для таких функций надо указать специальный тип возвращаемого значения void:

void foo() {
   ...
}

Соответственно, в таких функциях можно использовать только return без значения, и в месте вызова такой функции ее результат нельзя никак использовать. Более того, можно не писать return в конце функции.

Локальные переменные внутри функции определяются стандартным образом: просто в коде функции объявляете переменную, когда она вам понадобилась. Записи типа питоновской global в C++ нет; наоборот, поскольку все локальные переменные надо явно объявлять, то если вы используете переменную, которую не объявляли, C++ будет думать, что это глобальная переменная (и если такой нет, то это будет ошибка компиляции).

Передача параметров в функции не так тривиальна, как в питоне. Во-первых, параметры можно объявлять как описано выше: просто тип и имя параметра. Тогда при вызове такой функции значения будут копироваться в соответствующие локальные переменные, т.е. в примере выше x, y и s будут копиями тех значений, которые были переданы в аргументы функции в момент вызова. Изменения в x, y и s не будут видны наружу. Это называется «передача параметров по значению».

Также возможна передача «по ссылке», она пишется так:

int foo(int& x, double& y, string& s) {
    ...
}

Теперь при вызове функции никаких копий переменных не делается, x, y и s указывают на ту же переменную, ту же память, что была передана в момент вызова функции. Т.е. если я вызываю функцию как foo(a, b, c), то внутри функции получается что x соответствует той же переменной, той же памяти, что и a, и изменения в x будут видны в a, и аналогично с y и s. Естественно, это тогда требует, чтобы при вызове функции в параметрах были указаны именно переменные, а не выражения, запись вида foo(q + w, b, c) не сработает, потому что q+w не есть переменная.

Передача по ссылке используется, когда вам надо реально снаружи функции видеть изменения переменных, но это считается довольно плохой практикой (потому что в месте вызова функции совершенно неочевидно, что переменная будет меняться).

И есть передача «по константной ссылке»:

int foo(const int& x, const double& y, const string& s) {
    ...
}

Это примерно то же, что передача по ссылке, только теперь эти переменные невозможно изменить внутри функции. За счет этого, во-первых, никакие изменения не будут видны снаружи (просто потому, что никаких изменений не будет вообще), во-вторых, можно в foo передавать и выражения, а не только переменные (можно писать foo(q + w, b, c).

Передача по константной ссылке используется в первую очередь чтобы избежать копирования значений. Скопировать int — это недолго. А вот скопировать string или vector может быть очень долго, если они длинные. А если вы передаете по константной ссылке, то копирований не будет. Например, если вы хотите передавать граф (матрицу смежности или списки смежные вершин) в функцию типа поиска в глубину, то передавайте по константной ссылке.

Естественно, варианты можно комбинировать как вам нужно, можно часть параметров передавать одним способом, часть — другим:

int foo(int x, double& y, const string& s) {
    ...
}

В целом, маленькие типы (в первую очередь примитивные типы данных, не массивы, не строки и не прочие сложные типы) обычно передают по значению, а большие — по константной ссылке. Передача по значению используется еще, если вам надо будет в функции все равно менять переменную, но так, чтобы снаружи это не было заметно — тогда без копии, конечно, не обойтись. Передаче по не-константной ссылке используется, если вам надо видеть изменения в переменной снаружи, и используется довольно редко.

Файловый ввод-вывод

Файловый ввод-вывод полностью аналогичен вводу с клавиатуры и выводу на экран. Надо подключить заголовочный файл fstream (от file stream), после этого создать объект типа ifstream для ввода (input file stream) или ofstream для вывода (output file stream), указав в скобках имя файла, и дальше работать с ними как с cin и cout:

#include <fstream>

....

ifstream in("input.txt");
int a, b;
in >> a >> b;

ofstream out("output.txt");
out << a + b;

Вам может потребоваться читать данные «до конца файла». Для этого вы можете легко проверить, было ли чтение успешным: каждая операция чтения возвращает некоторый объект (на самом деле тот же самый поток ввода), который можно проверить в условии if или while. Например, так можно считать все числа из входного файла и посчитать их сумму:

int sum = 0;
int x;
while (in >> x) {  // пока чтение успешно
    sum += x;
}

При этом у объектов потоков (в данном случае in) есть метод eof, который сообщает, кончился ли уже файл, и вы можете захотеть написать типа

// так делать не надо
while (!in.eof()) {
    int x;
    in >> x;
    ...
}

Но так не заработает. Дело в том, что файловый поток ввода узнает, что файл кончился, только после неуспешной попытки чтения. Т.е. когда вы прочитали последнее число, условие in.eof() будет еще ложным. Вы попробуете считать еще одно число, чтение будет неуспешным, в x что-то окажется (начиная с C++11 гарантируется, что там окажется ноль, но я бы не полагался на это), и только после этого in.eof() вернет true. Естественно, это не то, что вы хотели. Правильно проверять результат считывания числа через while (in >> x) или т.п.

Аналогично, не надо никогда читать while (in) {...}, потому что проверка самого потока тоже станет ложной только после неудачного чтения.