Skip to content

Latest commit

 

History

History
324 lines (219 loc) · 23.3 KB

README.RU.md

File metadata and controls

324 lines (219 loc) · 23.3 KB

Система контактов SynapseGrid

Ключевые особенности

  1. SynapseGrid обеспечивает возможность композиции функций, далеко выходящую за возможности монад.
  2. При использовании совместно с Akka-экторами появляется возможность строго типизированной обработки сообщений, существенно превосходящая Typed actors.
  3. Возможность конструирования составных функций, имеющих много входов и выходов.

(С причинами создания системы контактов SynapseGrid можно ознакомиться в документе Потребности систем ведения диалога .)

Концепция макетной платы

Система Контактов основана на нескольких базовых принципах, которые будут рассмотрены в этом разделе.

Представьте себе макетную плату для сборки электронных схем. В этой плате подготовлены отверстия и контактные площадки. Некоторые контакты подписаны и расположены так, чтобы к ним было удобно подсоединять электронные приборы. Другие контакты служебные и просто используются для связи компонентов.

На макетной плате могут быть установлены компоненты, образующие, например, блок питания, или усилитель низкой частоты, или фильтр, или какую-нибудь ещё подсистему. Причём на такой плате могут остаться незадействованными часть контактов для подсистем, которые в собираемом устройстве не требуются. К ним не будут подсоединены никакие компоненты. Некоторые выводы блока питания могут оказаться невостребованными. Или часть входов универсальной микросхемы могут остаться неиспользованными.

Метафора макетной платы может служить неплохой иллюстрацией к системе контактов.

Контакты и двухполюсники

Контактом называется объект типа Contact[T], имеющий имя, обычно совпадающее с именем переменной, в которой хранится ссылка на него. Пример (все примеры на языке Scala):

	val myContact = contact[String]("myContact")

Контакт не содержит данных, он только обозначает точку в макетной плате. К нему могут быть подсоединены входы или выходы компонентов, имеющих тип String.

Двухполюсным компонентом или "стрелочкой" является компонент, имеющий один вход и один выход. В простейшем и наиболее широко применяемом случае в качестве компонента может использоваться обычная функция

	def getLength(s:String) = s.length

Запишем теперь конструкцию, которая для каждой поступающей строки будет вычислять её длину:

	val len = contact[Int]("len")
	myContact -> len map getLength

или, более коротко,

	val len = myContact.map(_.length)

На рисунке изображён пример системы (подключены дополнительные контакты - вход и выход, чтобы можно было запускать тесты).

example1 system picture

(В последнем случае контакт len будет создан автоматически и соответствующего типа (Int).)

Обработка данных

Вышеприведённый код сам по себе не выполняет никакой работы. В контактах данные не хранятся, в функциях тоже не хранятся. Этот код только описывает структуру системы — какие контакты с какими компонентами связаны.

Для того, чтобы связать данные с каким-либо контактом, используется «внешнее связывание». То есть создаётся объект, содержащий ссылку как на контакт, так и на данные, связанные с этим контактом. Такой объект в терминологии Системы Контактов называется Сигналом.

	case class Signal[T](contact:Contact[T], data:T)

(Кроме термина Сигнал можно встретить термины Событие, Данные, Фрейм, Сообщение.)

Состояние системы представляется списком сигналов на разных контактах в один дискретный момент времени.

	type Signals = List[Signal[_]]

Реализован специальный компонент SignalProcessor, который выполняет функциональное преобразование исходного списка сигналов в один момент времени в список сигналов последующий момент времени. Каждый сигнал по очереди передаётся на вход каждого компонента, подключенного к соответствующему контакту. Результат работы компонента в форме сигнала (или нескольких сигналов) добавляется к списку сигналов следующего момента времени. Когда все сигналы предшествующего момента времени обработаны, SignalProcessor завершает работу.

В теории скрытых марковских моделей есть хорошее понятие треллис (trellis). Это развёртка во времени совокупности сигналов. И SignalProcessor как раз и используется для построения trellis'а на основе входных данных.

В какой момент останавливается построение trellis'а? Если обработку никак не останавливать, то все данные дойдут до крайних контактов и, т.к. там не подключено никаких компонентов, то данные исчезнут. Чтобы этого избежать, в описании системы указывается, какие контакты являются выходными

	outputs(len) // outputs(output1, output2, output3)

поэтому обработка останавливается тогда, все сигналы в текущем списке принадлежат множеству выходных контактов.

См. также Конвертация систем.

Типы стрелочек

При обработке данных часто возникает ситуация, когда на один входной элемент генерируется 0 и больше выходных элементов. Обработка такой ситуации в языке Scala осуществляется с помощью функции высшего порядка flatMap. Поэтому в системе контактов стрелочки, аннотированные функциями, возвращающими 0..n элементов, имеют тип FlatMap.

	val wordsContact = someStringContact.flatMap(_.split("\\s+".r))

Система будет выглядеть примерно так

example2 system picture

Важным частным случаем стрелочек типа FlatMap являются стрелочки 0..1, пропускающие или не пропускающие данные в зависимости от некоторых условий. Предусмотрен специальный метод для создания таких стрелочек — filter:

	val nonEmptyString = myContact.filter(_.length>0)

For-comprehension совместимость

Интересной особенностью языка Scala является возможность использования syntactic sugar для пользовательских методов. В частности, так как в системе контактов объявлены методы map, flatMap, filter и withFilter, появляется возможность использовать for-comprehension:

	val helloContact = for {
	   s <- myContact
	   if s.length >0
	} yield "Hello, "+s

Этот код эквивалентен цепочке, состоящей из двух стрелочек:

	val helloContact = myContact.filter(s => s.length>0).map(s=>"Hello, "+s)

В некоторых случаях, когда алгоритм обработки разветвляется не очень сильно, такой синтаксис выглядит неплохо.

Работа с состоянием

До сих пор все примеры оперировали только данными, приходящими на входной контакт. Результат нигде не сохранялся и передавался далее. То есть использовались "чистые" функции без побочных эффектов — immutable. Такие функции обладают массой полезных свойств. Например, легко распараллелить обработку на несколько потоков. Не требуется пересоздавать систему для обработки других данных — достаточно один раз при старте приложения её создать. Отладка таких систем практически исключена за ненадобностью — из-за отсутствия внутреннего состояния и побочных эффектов результат всегда детерминированно определяется входными данными.

Если логика обработки данных требует сохранения состояния, то первое, что приходит в голову — использовать внутри функции переменную и сохранять состояние в ней. К примеру, так:

	var counter = 0
	val helloCount = myContact.map({any => 	counter += 1;  counter})

Этот способ будет работать, но, к сожалению, мы теряем все преимущества immutable системы.

А что, если хранить состояние отдельно от системы? И в нужный момент перед работой функции текущее состояние извлекается, а потом помещается обратно.

Как работать с таким состоянием, которое где-то хранится? Функция должна принимать на вход текущее значение состояния и возвращать новое значение.

	val helloCount = myContact.[указание на переменную, где хранится состояние counter].map({(any, counter) => (counter+1, counter + 1)})

Давайте более внимательно посмотрим на эту функцию. Запишем её verbose через def:

	def incCounter(any:String, counter:Int) : (Int, Int) = {
	  val newCounterValue = counter+1
	  val resultOfThisFunction = newCounterValue
	  return (resultOfThisFunction, newCounterValue)
	}

Функция, обрабатывающая состояние, — чистая. Ч.т.д.

Остаётся только определиться, как нам ловко хранить и извлекать состояние.

Для идентификации различных переменных состояния мы будем использовать разновидность контакта — StateHandle[T].

	val counterS = state[Int]("counterS", 0)
	val helloCount = contact[Int]("helloCount")

Такой идентификатор содержит название переменной, тип и начальное значение.

Текущее значение состояния при объявлении недоступно. Оно нигде не хранится. (Забегая немного вперёд: SignalProcessor хранит текущие значения всех переменных состояния в Map'е).

Чтобы в нашей функции helloCounter использовать это состояние, необходимо на него сослаться:

    (myContact.withState(counterS) -> helloCount).stateMap({(counter: Int, any:String) => (counter + 1, counter + 1)},"inc "+counterS)
	val helloCount = myContact.stateMap(counterS, {(any, counter) => (counter+1, counter + 1)})

В итоге получилось несколько громоздко, но зато мы имеем все преимущества чистых функций.

example3 system picture

В DSL имеется набор вспомогательных функций высшего порядка, упрощающих работу с состояниями.

Рисование схемы системы

Так как наша система описана полностью декларативно, сразу же появляется возможность её анализа. В частности, очень удобно смотреть на граф системы.

Чтобы получить изображение системы, достаточно вызвать метод toDot. В этом методе производится обход всех элементов системы (контактов, стрелочек, подсистем) и формируется текстовый файл в формате dot. Эти рисунки можно преобразовать в формат png с помощью одной из команд

    dot -Tpng example3.dot > example3.png
    dot -Tpng -O example3.dot 

(Рисунки в папке images получены как раз с помощью такой команды.)

Непосредственно просмотреть такой файл можно с помощью, например, программы XDot или ZGRViewer (windows).

Конструирование системы с помощью Builder'ов

Все примеры создания контактов и стрелочек должны находиться в каком-нибудь классе/трейте, унаследованном от SystemBuilder. Именно в нём находятся основные методы, позволяющие инкрементно создавать контакты и разнообразные стрелочки. Сам SystemBuilder, как подсказывает его название, является mutable классом и не участвует непосредственно в runtime-обработке. Чтобы получить чистое описание системы, построенное Builder'ом, достаточно вызвать метод toStaticSystem. Этот метод возвращает простой immutable case-класс, содержащий все контакты и стрелочки.

Некоторые специальные DSL находятся в отдельных трейтах, которые надо просто подключить к своему Builder'у, чтобы этим DSL воспользоваться.

Для конструирования системы кроме очевидного способа

	val sb = new SystemBuilderC("MySystem")
	import sb._
	...
	val system = sb.toStaticSystem

можно пользоваться также и наследованием trait'а:

	trait MySystemBuilder extends SystemBuilder {
	  // setSystemName("MySystem") 
	  ...
	}

	val system = new MySystemBuilder.toStaticSystem

После получения StaticSystem, её можно непосредственно использовать в SignalProcessor'е для обработки сигналов. При этом состояние системы придётся всё время передавать на вход SignalProcessor'у и запоминать при возврате. Чтобы упростить управление состоянием, имеется специальный класс DynamicSystem = StaticSystem + State. Пользоваться таким классом можно как обычной функцией (правда, имея в виду, что внутри спрятано состояние и функция имеет побочный эффект).

Подсистемы

По мере увеличения программы, написанной на контактах, возникает необходимость выделения блоков в подсистемы для целей повторного использования. Чтобы добавить подсистему, используется метод addSubsystem. Так как у подсистемы имеется своё состояние, то также указывается stateHandle, где будет хранится состояние.

	val subsystem = new MySubsystemBuilder.toStaticSystem
	val s1 = state[SystemState]("s1", subsystem.s0)
	sb.addSubsystem(subsystem, s1)

Чтобы подсистема получала входные данные, некоторые её контакты должны быть объявлены как входные:

	inputs(input1, input2)

в этом случае данные, появляющиеся во внешней системе на соответствующих контактах, будут обработаны подсистемой.

Организация подсистем

Многопоточность

Описанные системы работают в одном потоке. Естественно, диаграмма DataFlow способствует переходу к работе с несколькими потоками.

Один из возможных способов перехода к многопоточности заключается в том, чтобы превратить целую систему в Actor, который уже будет совместим с параллельностью Akka.

Другой способ, обеспечивающий значительно более высокую степень параллелизма, заключается в запуске всех чистых функций на ExecutionContext'е. При этом необходимо следить за тем, чтобы доступ к состояниям был сериализован и соответствовал принципу "happen-before". То есть вычисления, которые могут повлиять на state, должны закончится раньше. А вычисления, которые зависят от state'а, не должны начинаться, пока наше вычисление не закончится. Получается "решётка" зависимостей между вычислениями.

Использование Akka Actor'ов

Если на вход Actor'а поступает Signal, то его обработка выполняется очевидным образом — сам сигнал передаётся во вложенную DynamicSystem. Для совместимости с программами, не работающими с сигналами, используется специальный контакт NonSignalWithSenderInput. Этот контакт имеет тип (ActorRef, Any). Первый элемент будет содержать sender поступивших данных, а второй элемент — собственно данные.

Подробности про поддержку Экторов.

Запуск системы в параллельном режиме

Никаких изменений не требуется вносить в систему. Нам достаточно предоставить экземпляр ExecutionContext'а и использовать параллельный конвертер:

   import scala.concurrent.ExecutionContext.Implicits.global
   val f = system.toStaticSystem. toParallelSimpleSignalProcessor. toMapTransducer(input, output)
   val y = f(x)

Результат работы в параллельном режиме должен быть идентичен результату, получаемому в однопоточном режиме. В этом можно убедиться, выполнив вычисления в однопоточном режиме:

   val g = system.toStaticSystem. toSimpleSignalProcessor. toMapTransducer(input, output)
   val y2 = g(x)
   assert(y === y2)

С точки зрения использования вся разница заключается в применении другого конвертера.