Присваивание | это... Что такое Присваивание? (original) (raw)
Присва́ивание — механизм в программировании, позволяющий динамически изменять связи объектов данных (как правило, переменных) с их значениями. Строго говоря, изменение значений является побочным эффектом операции присвоения, и во многих современных языках программирования сама операция также возвращает некоторый результат (как правило, копию присвоенного значения). На физическом уровне результат операции присвоения состоит в проведении записи и перезаписи ячеек памяти или регистров процессора.
Присваивание является одной из центральных конструкций в императивных языках программирования, эффективно и просто реализуется на фон-неймановской архитектуре, которая является основой современных компьютеров.
В логическом программировании принят другой, алгебраический подход. Обычного («разрушающего») присвоения здесь нет. Существуют только неизвестные, которые ещё не вычислены, и соответствующие идентификаторы для обозначения этих неизвестных. Программа только определяет их значения, сами они постоянны. Конечно, в реализации программа производит запись в память, но языки программирования этого не отражают, давая программисту возможность работать с идентификаторами постоянных значений, а не с переменными.
В чистом функциональном программировании не используются переменные, и явный оператор присваивания не нужен.
Содержание
Определение
Общий синтаксис простого присваивания выглядит следующим образом:
<выражение слева> <оператор присваивания> <выражение справа>
«Выражение слева» должно после вычисления привести к местоположению объекта данных, к целевой переменной, идентификатору ячейки памяти, в которую будет производиться запись. Такие ссылки называются «левосторонними значениями» (англ. lvalue). Типичные примеры левостороннего значения — имя переменной (x
), путь к переменной в пространстве имён и библиотеках (Namespace.Library.Object.AnotherObject.Property
), путь к массиву с выражением на месте индекса (this.a[i+j*k]
), но ниже в данной статье приведены и более сложные варианты.
«Выражение справа» должно обозначать тем или иным способом ту величину, которая будет присвоена объекту данных. Таким образом, даже если справа стои́т имя той же переменной, что и слева, интерпретируется оно иначе — такие ссылки называются «правосторонними значениями» (англ. rvalue). Дальнейшие ограничения на выражение накладывает используемый язык: так, в статически типизированных языках оно должно иметь тот же тип, что и целевая переменная, либо тип, приводимый к нему; в некоторых языках (например, Си или Python) в выражение может входить также другая операция присваивания (a=b=c
).
В роли оператора присваивания в языках программирования чаще всего выступают =
, :=
или ←
. Но специальный синтаксис может и не вводится — например, в Tcl:
set <целевая_переменная> <выражение>
Данная запись эквивалентна вызову функции. Аналогично, в КОБОЛе старого стиля:
MULTIPLY 2 BY 2 GIVING FOUR.
Алгоритм работы
- Вычислить левостороннее значение первого операнда. На этом этапе становится известным местонахождение целевого объекта, приёмника нового значения.
- Вычислить правостороннее значение второго операнда. Этот этап может быть сколь угодно большим и включать другие операторы (в том числе присвоения).
- Присвоить вычисленное правостороннее значение левостороннему значению. Во-первых, при конфликте типов должно быть осуществлено их приведение (либо выдано сообщение об ошибке ввиду его невозможности). Во-вторых, собственно присваивания значения в современных языках программирования может быть подменено и включать не только перенос значений ячеек памяти (например, в «свойства» объектов в C#, перегрузка операторов).
- Возвратить вычисленное правостороннее значение как результат выполнения операции. Требуется не во всех языках (например, не нужно в Паскале).
Обозначение
Выбор символа присваивания является поводом для споров разработчиков языков. Существует мнение, что использование символа =
для присвоения запутывает программистов, а также ставит сложный для хорошего решения вопрос о выборе символа для оператора сравнения.
Так, Никлаус Вирт утверждал[1]:
Общеизвестным плохим примером является выбор знака равенства для обозначения присваивания, восходящий к языку Fortran в 1957 году и слепо повторяемый до сих пор массой разработчиков языков. Эта плохая идея низвергает вековую традицию использования знака «=» для обозначения сравнения на равенство, предиката, принимающего значения «истина» или «ложь». Но в Fortran этот символ стал обозначать присваивание, принуждение к равенству. В этом случае операнды находятся в неравном положении: левый операнд, переменная, должен быть сделан равным правому операнду, выражению. Поэтому x = y не означает то же самое, что y = x.
Оригинальный текст (англ.)
A notorious example for a bad idea was the choice of the equal sign to denote assignment. It goes back to Fortran in 1957 and has blindly been copied by armies of language designers. Why is it a bad idea? Because it overthrows a century old tradition to let “=” denote a comparison for equality, a predicate which is either true or false. But Fortran made it to mean assignment, the enforcing of equality. In this case, the operands are on unequal footing: The left operand (a variable) is to be made equal to the right operand (an expression). x = y does not mean the same thing as y = x.[2]
Реализацией этой позиции Вирта можно считать то, что в языке Паскаль, автором которого он является, оператором присваивания является :=
, в то время как для сравнения используется просто =
.
Выбор символа оператора равенства в языке при использовании =
как присваивания решается:
- Введением нового символа языка для оператора проверки равенства.
Запись равенства в Си ==
является источником частых ошибок из-за возможности использования присваивания в управляющих конструкциях, но в других языках проблема решается введением дополнительных ограничений.
- Использованием этого же символа, значение определяется в зависимости от контекста.
Например, в выражении языка ПЛ/1:
А = В = С
переменной А
присваивается булевское значение выражения отношения В = С
. Такая запись приводит к снижению читабельности и редко используется.
Семантические особенности
Далеко не всегда «интуитивный» (для программистов императивных языков) способ интерпретации присваивания является единственно верным и возможным.
По используемому синтаксису в императивных языках не всегда возможно понять, как реализуется семантика присваивания, если это явно не определено в языке.
Например, в языке Форт перед присваиванием значение и адрес переменной должны попасть в стек данных и это может быть сделано задолго до выполнения собственно присваивания.
Пример:
\ Определение переменной AAA и следующей строкой присваивание ей значения 10 VARIABLE AAAA 10 AAA !
То же самое немного иначе:
10 VARIABLE AAA AAA !
Неоднозначность
Рассмотрим пример:
X = 2 + 1
Это можно понять как «результат вычисления 2+1 (то есть 3) присваивается переменной X
» или как «операция 2+1 присваивается переменной X
». Если язык статически типизирован, то двусмысленности нет, она разрешается типом переменной X
(«целое число» или «операция»). В языке Пролог типизация динамическая, поэтому существуют две операции присвоения: is
— присвоение эквивалентного значения и =
— присвоение образца. В таком случае:
X is 2 + 1, X = 3 X = 2 + 1, X = 3
Первая последовательность будет признана верной, вторая — ложной.
Семантика ссылок
При работе с объектами больших размеров и сложной структуры многие языки используют так называемую «семантику ссылок». Это означает, что присвоения в классическом смысле не происходит, но считается, что значение целевой переменной располагается на том же месте, что и значение исходной. Например (Python):
a = [1, 2, 3] b = a a[1] = 1000
После этого b
будет иметь значение [1, 1000, 3]
— просто потому, что фактически его значение — это и есть значение a
. Число ссылок на один и тот же объект данных называется его мощностью, а сам объект погибает (уничтожается или отдаётся сборщику мусора), когда его мощность достигает нуля. Языки программирования более низкого уровня (например, Си) позволяют программисту явно управлять тем, используется ли семантика указателей или семантика копирования.
Подмена операции
Многие языки предоставляют возможность подмены смысла присвоения: либо через механизм свойств, либо через перегрузку оператора присвоения. Подмена может понадобится для выполнения проверок на допустимость присваиваемого значения или любых других дополнительных операций. Перегрузка оператора присвоения часто используется для обеспечения «глубокого копирования», то есть копирования значений, а не ссылок, которые во многих языка копируются по умолчанию.
Такие механизмы позволяют обеспечить удобство при работе, так для программиста нет различия между использованием встроенного оператора и перегруженного. По этой же причине возможны проблемы, так как действия перегруженного оператора могут быть абсолютно отличны от действий оператора по умолчанию, а вызов функции не очевиден и легко может быть принят за встроенную операцию.
Расширенные конструкции
Конструкции присвоения в различных языках программирования
Поскольку операция присвоения является широко используемой, разработчики языков программирования пытаются разработать новые конструкции для упрощённой записи типичных операций (добавить в язык так называемый «синтаксический сахар»). Кроме этого в низкоуровневых языках программирования часто критерием включения операции является возможность компиляции в эффективный исполняемый код.[3] Особенно известен данным свойством язык Си.
Множественные целевые объекты
Одной из альтернатив простого оператора является возможность присвоения значения выражения нескольким объектам. Например, в языке ПЛ/1 оператор
SUM, TOTAL = 0
одновременно присваивает нулевое значение переменным SUM
и TOTAL
. В языке Ада присвоение также является оператором, а не выражением, поэтому запись множественного присвоения имеет вид:
SUM, TOTAL: Integer := 0;
Аналогичное присвоение в языке Python имеет следующий синтаксис:
sum = total = 0
В отличие от ПЛ/1, Ады и Питона, где множественное присвоение считается только сокращённой формой записи, в языках Си, Лисп и других данный синтаксис имеет строгую основу: просто оператор присвоения возвращает присвоенное им значение (см. выше). Таким образом, последний пример — это на самом деле:
sum = (total = 0)
Строчка такого вида сработает в Си (если добавить точку с запятой в конце), но вызовет ошибку в Питоне.
Параллельное присваивание
Некоторые языки, например Руби и Python, поддерживают расширенный синтаксис присвоения, который называется параллельным присвоением:
a, b = 1, 11
Считается, что такое присвоение выполняется одновременно и параллельно, что позволяет коротко реализовать с помощью такой конструкции операцию обмена значений двух переменных.
запись с использованием параллельного присваивания | «традиционное» присвоение: требует дополнительной переменной и трёх операций | «экономное» присвоение: не требует дополнительной переменной, но также содержит три операции |
---|---|---|
a, b = b, a | t = a a = b b = t | a = a + b b = a - b a = a - b |
Последний вариант с арифметическими операциями небезопасен в языках программирования или на аппаратных платформах, которые проверяют наличие арифметических переполнений.
Некоторые языки (например, PHP) имеют конструкции, позволяющие сымитировать параллельное присваивание:
list($a, b)=array(b) = array(b)=array(b, $a);
Условные целевые объекты
Некоторые языки программирования, например, C++, допускают использование в операторах присвоения условных целевых объектов. Например, выражение:
(flag ? count1 : count2) = О
присвоит 0
переменной count1
если flag
истинно и count2
, если flag
ложно.
Другой вариант условного присваивания (Руби):
a ||= 10
Данная конструкция присваивает переменной a
значение только в том случае, если значение ещё не присвоено или равно false
.
Составные операторы
Составной оператор присваивания позволяет сокращённо задавать часто используемую форму присвоения. С помощью этого способа можно сократить запись присвоения, при котором целевая переменная используется в качестве первого операнда в правой части выражения, например:
а = а + b
Синтаксис составного оператора присваивания языка Си представляет собой объединение нужного бинарного оператора и оператора =
. Например, следующие записи эквивалентны
sum += value; | sum = sum + value; |
---|
В языках программирования, поддерживающих составные операторы (C++, C#, Python, Java и др.), обычно существуют версии для большинства бинарных операторов этих языков (+=
, -=
, &=
и т. п.).
Унарные операторы
В языке программирования Си и большинстве производных от него есть два специальных унарных (то есть имеющих один аргумент) арифметических оператора, представляющих собой в действительности сокращённые присваивания. Эти операторы сочетают операции увеличения и уменьшения на единицу с присваиванием. Операторы ++
для увеличения и --
для уменьшения могут использоваться как префиксные операторы (то есть перед операндами) или как постфиксные (то есть после операндов), означая различный порядок вычислений. Оператор префиксной инкрементации возвращает уже увеличенное значение операнда, а постфиксной — исходное.
Пример использования оператора инкрементации для формирования завершённого оператора присвоения:
увеличение значения переменной на единицу | эквивалентная расширенная запись |
---|---|
count ++; | count = count + 1; |
Хоть это и не выглядит присваиванием, но таковым является. Результат выполнения приведённого выше оператора равнозначен результату выполнения присваивания.
Операторы инкрементации и декрементации в языке Си часто являются сокращённой записью для формирования выражений, содержащих индексы массивов.
Реализация
Работа современных компьютеров состоит из считываний данных из памяти или устройства в регистры, выполнения операций над этими данными и записи в память или устройство. Основной операцией здесь является пересылка данных (из регистров в память, из памяти в регистр, из регистра в регистр). Соответственно, она выражается напрямую командами современных процессоров. Так для архитектуры x86 (все нижеприведённые команды относятся также к данной архитектуре) это операция mov
и её разновидности для пересылки данных различных размеров. Операция присваивания (пересылка данных из одной ячейки памяти в другую) практически непосредственно реализуется данной командой. Вообще говоря, для выполнения пересылки данных в памяти требуется две инструкций: перемещение из памяти в регистр и из регистра в память, но при использовании оптимизации в большинстве случаев количество команд можно сократить.
movl -4(%ebp), %eax
movl %eax, 8(%ebp)
См. также
Примечания
- ↑ Никлаус Вирт. Хорошие идеи: взгляд из Зазеркалья. Пер. Сергей Кузнецов (2006). Архивировано из первоисточника 23 августа 2011. Проверено 23 апреля 2006.
- ↑ Niklaus Wirth. Good Ideas, Through the Looking Glass. Архивировано из первоисточника 25 июня 2012. Проверено 4 декабря 2010.
- ↑ В целях оптимизации многие операции совмещаются с присваиванием. Для сокращённых записей присвоения зачастую есть эквивалент в машинных инструкциях. Так, увеличение на единицу реализуется машинной инструкцией
inc
, уменьшение на единицу —dec
, сложение с присвоением —add
, вычитание с присвоением —sub
, команды условной пересылки —cmova
,cmovno
и т. д.
Литература
- Роберт В. Себеста. Основные концепции языков программирования = Concepts of Programming Languages. — 5-е изд. — М.: Вильямс, 2001. — 672 с. — ISBN 0-201-75295-6
- М. Бен-Ари. Языки программирования. Практический сравнительный анализ. — М.: Мир, 2000. — 366 с. С. 71—74.
- В. Э. Вольфенгаген. Конструкции языков программирования. Приёмы описания. — М.: АО «Центр ЮрИнфоР», 2001. — 276 с. ISBN 5-89158-079-9. С. 128—131.
- Э. А. Опалева, В. П. Самойленко. Языки программирования и методы трансляции. — СПб.: БХВ-Петербург, 2005. — 480 с. ISBN 5-94157-327-8. С. 74—75.
- Т. Пратт, М. Зелковиц. Языки программирования: разработка и реализация. — 4-е изд. — СПб: Питер, 2002. — 688 с. ISBN 5-318-00189-0, ISBN 0-13-027678-2. С. 201—204.