Семантическая модель гостиная. Определение системы как семантической модели. Система с управлением

Для моделирования предметных областей широкое распространение получили реляционные СУБД. Их использование в самых разнообразных приложениях показывает, что реляционная модель данных достаточно универсальна. Однако проектирование реляционной БД в терминах отношений часто представляет собой очень сложный и неудобный для проектировщика процесс.

При этом ограниченность реляционной модели данных проявляется в следующих аспектах:

· Модель не обеспечивает достаточных средств представления смыслового содержания данных. Семантика реальной предметной области должна независимым от модели способом отображаться в сознание проектировщика. В частности, это относится к проблеме представления ограничений целостности;

· Для многих приложений трудно моделировать предметную область на основе плоских таблиц. В ряде случаев на самой начальной стадии проектирования разработчику приходится описывать предметную область в виде одной (возможно, даже ненормализованной) таблицы.

Хотя весь процесс проектирования происходит на основе учета зависимостей, реляционная модель не обеспечивает каких-либо средств для представления этих зависимостей.

Несмотря на то, что процесс проектирования начинается с выделения некоторых значимых для приложения объектов предметной области ("сущностей") и выявления связей между этими сущностями, реляционная модель данных не предлагает какого-либо аппарата для разделения сущностей и связей.

Потребности проектировщиков БД в более удобных и мощных средствах моделирования предметной области реализуются при использовании

= семантических моделей данных =

Любая развитая семантическая модель данных, как и реляционная модель, включает структурную , манипуляционную и целостную части.

Главным назначением семантических моделей является обеспечение возможности выражения семантики данных.

Наиболее часто на практике семантическое моделирование используется на первой стадии проектирования БД. При этом в терминах семантической модели производится концептуальная схема БД, которая затем вручную преобразуется к реляционной (или какой-либо другой) схеме. Этот процесс выполняется под управлением методик, в которых достаточно четко оговорены все этапы такого преобразования.

Менее часто реализуется автоматизированная компиляция концептуальной схемы в реляционную модель.

Известны два подхода:

· на основе явного представления концептуальной схемы как исходной информации для компилятора;

· построение интегрированных систем проектирования с автоматизированным созданием концептуальной схемы на основе интервью с экспертами предметной области.

Третья возможность , которая пока только выходит за пределы исследовательских и экспериментальных проектов, – это работа с БД в семантической модели, то есть СУБД, основанные на семантических моделях данных.

При этом снова рассматриваются два варианта:

· обеспечение пользовательского интерфейса на основе семантической модели данных с автоматическим отображением конструкций в реляционную модель данных (это задача примерно такого же уровня сложности, как автоматическая компиляция концептуальной схемы БД в реляционную схему);

· прямая реализация СУБД, основанная на какой-либо семантической модели данных.

Наиболее близко ко второму подходу находятся современные объектно-ориентированные СУБД, модели данных которых по многим параметрам близки к семантическим моделям (хотя в некоторых аспектах они более мощны, а в некоторых – более слабы).

Основные понятия модели «Entity - Relationship».

Семантическая модель данных Entity - Relationship – модель "Сущность - Связи " (ER-модель).

На использовании разновидностей ER-модели основано большинство современных подходов к проектированию БД (главным образом, реляционных). Модель была предложена Ченом (Chen) в 1976 г. Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных компонентов.

В связи с наглядностью представления концептуальных схем БД ER-модели получили широкое распространение в системах CASE, поддерживающих автоматизированное проектирование реляционных БД. Среди множества разновидностей ER-моделей наиболее развитая модель применяется в системе CASE (фирмы ORACLE).

Основными понятиями ER-модели являются:

«сущность – связь – атрибут».

Сущность – это реальный или представляемый объект, информация о котором должна сохраняться и быть доступна. В диаграммах ER-модели сущность представляется в виде прямоугольника, содержащего имя сущности. При этом имя сущности – это имя типа, а не некоторого конкретного экземпляра этого типа. Сущность «АЭРОПОРТ», с примерными объектами «Шереметьево» и «Хитроу», приведена на рис. 2.24.

Рис. 2.24. Сущность – АЭРОПОРТ с примерными объектами: Шереметьево и Хитроу

Для большей выразительности и лучшего понимания имя сущности может сопровождаться примерами конкретных объектов этого типа.

Каждый экземпляр сущности должен быть отличим от любого другого экземпляра той же сущности (это требование в некотором роде аналогично требованию отсутствия кортежей-дубликатов в реляционных таблицах).

Связь – это графически изображаемая ассоциация, устанавливаемая между двумя сущностями. Эта ассоциация всегда является бинарной и может существовать между двумя разными сущностями или между сущностью и ею же самой (рекурсивная связь ).

В любой связи выделяются два конца (в соответствии с существующей парой связываемых сущностей), на каждом из которых указывается имя конца связи , степень конца связи (сколько экземпляров данной сущности связывается), обязательность связи (т. е. любой ли экземпляр данной сущности должен участвовать в данной связи).

Связь представляется в виде линии, связывающей две сущности или ведущей от сущности к ней же самой. При этом в месте "стыковки" связи с сущностью используются трехточечный вход в прямоугольник сущности, если для этой сущности в связи может использоваться много (many) экземпляров сущности, и одноточечный вход, если в связи может участвовать только один экземпляр сущности.

Обязательный конец связи изображается сплошной , а необязательный – прерывистой линией.

Как и сущность, связь – это типовое понятие, все экземпляры обеих пар связываемых сущностей подчиняются правилам связывания.

В примере, изображенном на рис. 2.25, связь между сущностями БИЛЕТ и ПАССАЖИР связывает билеты и пассажиров. При этом конец сущности с именем "для" позволяет связывать с одним пассажиром более одного билета, причем каждый билет должен быть связан с каким-либо пассажиром. Конец сущности с именем "имеет" означает, что каждый билет может принадлежать только одному пассажиру, причем пассажир не обязан иметь хотя бы один билет.

Рис. 2.26. Рекурсивная связь, связывающая сущность ЧЕЛОВЕК

Конец связи с именем "сын" определяет тот факт, что у одного отца может быть более чем один сын. Конец связи с именем "отец" означает, что не у каждого человека могут быть сыновья.

Атрибутом сущности является любая деталь, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности. Имена атрибутов заносятся в прямоугольник, изображающий сущность, под именем сущности и изображаются малыми буквами, возможно с примерами.

Нормальные формы ER-схем.

Как и в реляционных схемах БД, в ER-схемах вводится понятие нормальных форм. Заметим, что формулировки нормальных форм ER-схем делают более понятным смысл нормализации реляционных схем.

Приведем краткие и неформальные определения трёх первых нормальных форм:

· устраняются повторяющиеся атрибуты или группы атрибутов, т.е. производится выявление неявных сущностей, "замаскированных" под атрибуты;

· устраняются атрибуты, зависящие только от части уникального идентификатора, эта часть уникального идентификатора определяет отдельную сущность.

· устраняются атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности.

К числу более сложных элементов модели относятся следующие:

· Подтипы и супертипы сущностей. Как в языках программирования с развитыми типовыми системами (например в языках объектно-ориентированного программирования), вводится возможность наследования типа сущности, исходя из одного или нескольких супертипов. Интересные нюансы связаны с необходимостью графического изображения этого механизма.

· Связи "many-to-many". Иногда бывает необходимо связывать сущности таким образом, что с обоих концов связи могут присутствовать несколько экземпляров сущности (наприме, все члены кооператива сообща владеют имуществом кооператива ). Для этого вводится разновидность связи "многие – со –

многими".

· Уточняемые степени связи. Иногда бывает полезно определить возможное количество экземпляров сущности, участвующих в данной связи (например служащему разрешается участвовать не более чем в трех проектах одновременно ). Для выражения этого семантического ограничения разрешается указывать на конце связи ее максимальную или обязательную степень.

· Каскадные удаления экземпляров сущностей. Некоторые связи бывают настолько сильными (в случае связи "один – ко – многим"), что при удалении опорного экземпляра сущности (соответствующего концу связи "один") нужно удалить и все экземпляры сущности, соответствующие концу связи "многие". Соответствующее требование "каскадного удаления" можно сформулировать при определении сущности.

· Домены . Как и в случае реляционной модели данных, иногда полезна возможность определения потенциально допустимого множества значений атрибута сущности (домена).

Эти и другие более сложные элементы модели данных "Сущность – Связи" делают ее существенно более мощной, но одновременно несколько усложняют ее использование. При реальном использовании ER-диаграмм для проектирования БД необходимо ознакомиться со всеми возможностями.

Разберем один из упомянутых элементов – подтип сущности .

Сущность может быть разделена на два или более взаимно исключающих подтипа. Каждый из них включает общие атрибуты и/или связи. Эти общие атрибуты и/или связи явно определяются один раз на более высоком уровне. В подтипах могут определяться собственные атрибуты и/или связи. В принципе «подтипизация» может продолжаться на более низких уровнях, но опыт показывает, что в большинстве случаев оказывается достаточно двух-трех уровней.

Сущность , на основе которой определяются подтипы, называется супертипом. Подтипы должны образовывать полное множество, т. е. любой экземпляр супертипа должен относиться к некоторому подтипу. Иногда для полноты приходится определять дополнительный подтип ПРОЧИЕ .

Пример – супертип ЛЕТАТЕЛЬНЫЙ АППАРАТ – приведён на рис. 2.27.

Иногда удобно иметь два или более разных разбиения сущности на подтипы.

Например, сущность ЧЕЛОВЕК может быть разбита на подтипы по профессиональному признаку (ПРОГРАММИСТ, ДОЯРКА и т. д.), а может –

по половому признаку (МУЖЧИНА, ЖЕНЩИНА).

Одной из попыток расширения возможностей СИИ является использование сочетания различных МПЗ фреймов и продукций (продукционные правила в слотах фрейма являются формой присоединения к фрейму процедурных знаний) семантических сетей и логических моделей семантических сетей и продукций. Однако простое объединение в одной БЗ нескольких МПЗ, получивших название комбинированных или смешанных, как правило, малоэффективно. Различные МПЗ не обязательно несовместимы друг с другом, однако они отличаются по степени соответствия конкретным внутренним представлениям эксперта.

К недостаткам подхода Ханта, ограничивающим применение результатов этих исследований, следует отнести специфичность языка описаний входных примеров и ограниченный смысл формируемых понятий. Кроме того, за рамками исследования осталось рассмотрение проблемы формирования взаимосвязанных понятий, что очень существенно для систем с искусственным интеллектом , использующих в качестве моделей проблемных сред модели семантического типа.

Этап концептуального проектирования включает создание концептуальной схемы БД. Спецификации разрабатываются в той степени, которая требуется для перехода к реализации. На этом этапе создаются подробные модели пользовательских представлений данных затем они интегрируются в концептуальную модель (семантическая модель), фиксирующую все элементы корпоративных данных, которые будет содержать БД.

Известно достаточно большое число семантических моделей данных (например, модель "сущность-связь", модель семантических сетей и др.) однако используемые в них понятия, идеи и методы характеризуются большим сходством, что облегчает их совместное рассмотрение.

Модель семантических сетей

Возможности выражения семантики в терминах сущностей и связей весьма ограничены. Повышение выразительной силы изобразительных средств достигается в модели семантической сети. В определенном смысле возможности семантической сети являются наиболее универсальными из известных к настоящему времени.

Принципиальными различиями обладают три модели представления знаний - продукционная модель , модель фреймов и модель семантических сетей.

Концептуальное проектирование служит для получения моделей семантического уровня, определяющих конкретную предметную область . Описание концептуальных моделей отражает объекты ЭИС и связи между ними, но не должно зависеть от методов представления данных в конкретной системе управления базами данных. Концептуальная модель - некоторое формализованное, заданное в явном виде, отображение предметной области , определяющее множество ее состояний, включая правила их изменения. Данная модель призвана обеспечить устойчивую и долговременную работу всей системы, выдерживать замену одного управляющего комплекса на другой.

Классификация показателей народнохозяйственного планирования должна носить многоаспектный характер и строиться в тесном взаимодействии со всеми другими общесоюзными и локальными классификаторами и номенклатурами. Последнее объясняется тем, что в наименованиях показателей находятся термины, входящие в различные классификаторы и номенклатуры. Используя зафиксированные в них отношения между терминами (род -вид, целое - часть и т. п.), можно определять семантические связи между показателями, в том числе вхождение их в определенные виды, типы и классы. Полный состав признаков классификации должен быть определен на основе анализа структуры планов, характера применяемых экономико-математических моделей , методов решения задач , включенных в методическое обеспечение АСПР.

Информация относительно ее возникновения и последующих преобразований проходит три этапа, которые, собственно, и определяют ее семантический, синтаксический и прагматический аспекты. Человек сначала наблюдает некоторый факт окружающей действительности, который отражается в его сознании в виде определенного набора данных. Здесь проявляется синтаксический аспект. Затем после структуризации этих данных в соответствии с конкретной предметной областью человек формирует знание о наблюдаемом факте. Это семантический аспект полученной информации. Информация в виде знаний имеет высокую степень структуризации, что позволяет выделять полную информацию об окружающей нас действительности и создавать информационные модели исследуемых объек-18

Виды знаний могут быть представлены одной из следующих семантических моделей

Приведено планирование базы данных, Выполнен анализ предметной области и построена схема объекты-взаимосвязи, выделены элементы данных и сформулированы семантические правила . Спроектирована модель данных, которая затем преобразуется в логическую модель конкретной системы управления базой данных.

К СЕМАНТИЧЕСКИ ПОЛНОЙ МОДЕЛИ

Так как отношения семантически полной модели могут

Заключительная фаза анализа предметной области состоит в проектировании ее информационной структуры (или концептуальной схемы). Описывать предметную область или проектировать концептуальную схему можно средствами достаточно большого количества моделей, созданных специально для этих целей. В простых случаях для построения концептуальной схемы используют традиционные методы агрегации и обобщений. При агрегации информационные объекты (элементы данных) объединяются в один в соответствии с семантическими связями между объектами.

В рамках каждой БД концептуальные требования обобщаются в концептуальную модель , выраженную абстрактными средствами, позволяющими увидеть все информационное содержание предметной области . Концептуальная модель позволяет как бы подняться вверх над предметной областью и увидеть ее отдельные элементы. При этом подробность, детальность и глубина предметной области зависит от выбранной модели. Модель с минимальными возможностями должна обеспечивать способность задания данных и их взаимосвязи. Соответственно семантическая мощь концептуальной модели увеличивается с возрастанием дополнительного числа характеристик, которые она позволяет оп-

Активные понятийные модели разрабатывались не только для хранения описаний используемых понятий и связей между ними. Ставились цели динамически формировать новые суждения, определять тождество или сходство понятий, производить их интерпретацию вычислительного характера. К таким моделям относятся разные представления семантических сетей , некоторые специальные понятийные модели, например . Однако создание технологически полных механизмов такого рода оказалось очень сложной задачей. Для непосредственного использования в промышленных разработках ИС активные понятийные модели до последнего времени были непригодны.

Определяются составляющие информационной модели , их взаимосвязь и последовательность разработки. Строится технологический маршрут разработки, выделяются отдельные этапы (фазы) процесса, устанавливаются структура и содержание исходных и конечных данных каждого этапа. Выполняются формальные процедуры семантического контроля выходных данных каждого этапа для отладки информационной модели и контроля процесса разработки проекта.

Трем типам знаний соответствуют и три типа моделей для их представления синтаксические, семантические и прагматические. Наличие двух последних является наиболее существенным признаком, отличающим интеллектуальные системы от всех других.

В основе моделей этого типа лежит конструкция, названная ранее семантической сетью . Сетевые модели формально можно задать в виде

Фрейм чаще всего определяют как структуру данных для представления стереотипных ситуаций. При этом способ группирования множества конкретных ситуаций в стереотипную, как правило, не может быть определен строго. Чаще всего стереотипные ситуации (для данной предметной области) выделяет исследователь, опираясь на опыт и данные наблюдений. Неформальные знания исследователя о предметной области можно рассматривать как систему понятий, определяющих представление о конкретных ситуациях . Каждое понятие связывается с конкретной ситуацией , а конкретные ситуации согласуются с соответствующей стереотипной. Если понятия представляют собой неформальные знания о стереотипной ситуации, то фреймы - это формализованные знания. Таким образом, фреймы соответствуют понятиям, отражающим объекты, явления, характеристики предметной области . Это дает основание рассматривать фрейм как семантический блок или модуль модели представления знаний . Модель представления знаний строится в виде сети фреймов, т. е. системы определенным образом взаимосвязанных фреймов. Поэтому в мо-

В ряде систем используются комбинации сетевых и продукционных моделей представления знаний . В таких моделях декларативные знания описываются в сетевом компоненте модели, а процедурные знания - в продукционном. В таком случае говорят о работе продукционной системы над семантической сетью.

В современном мире пропаганда давно уже перестала быть чисто идеологическим занятием, она покоится на жестких научных основаниях. Именно последняя война, получившая название "холодной", была на самом деле войной семантической, войной семиотической. Она дала значительный стимул развитию коммуникативных моделей воздействия. Они в достаточной мере научны, хотя и формулируются с непривычной для нашего уха долей цинизма. Так, американцы считают, что им лучше обработать одного журналиста, чем десять домохозяек или пять врачей. Поскольку человек при этом рассматривается как канал, а не как адресат информации.

Модель семантической сети (модель Куилиана). Семантическая сеть - это направленный граф с поименованными

Семантические барьеры могут создавать коммуникативные проблемы для компаний, действующих в многонациональной среде. Например, фирма Дженерал Моторс, выбросив на латиноамериканский

Глава 12

В последней двенадцатой главе мы нарушим одну традицию, сложившуюся при обучении базам данных. Не принято слишком глубоко интересоваться природой отображаемых сущностей и семантикой данных. Не рассматриваются двухслойные модели данных, в которых первый слой обеспечивает структуры хранения и работу с данными в некоторой базисной модели. Второй слой работает со структурами данных, которые в первом слое рассматривались как неделимые, атомарные.

В предыдущих главах предполагалось, что в базах данных хранятся сущности, у которых есть имя и атрибуты. Атрибуты имеют тип. В объектных моделях к атрибутам добавляются ещё методы. Появляются объектные типы, а сами сущности (классы) и их члены могут иметь не только предопределённые скалярные типы, но и объектные. Такая вот благостная и вполне привычная для программистского взгляда картина, немного усложненная свойством персистентности.

Для того, чтобы не путать сущности, хранимые в базе, с их прообразами в предметной области будем называть последние концептами (понятиями) этой области. Оказывается, что в базах данных обычно представляются всего два вида концептов. Это, как правило, концепты с одним сортом атрибутов, которые мы будем называть обязательными, и, изредка, полуструктурированные концепты, допускающие необязательные атрибуты.

Мы попробуем расширить модель представимого концепта, введя атрибуты состояния, ресурсов и смыслов. При этом обнаружится, что концепты с обязательными и необязательными атрибутами описывают замкнутые системы. Атрибуты состояния, как и следовало ожидать, характерны для динамических объектов. Атрибуты ресурсов позволяют описать обмен энергетическими, предметными и информационными сущностями и, тем самым, моделировать открытые системы.

Рассмотрим моделирование одних моделей данных в других (эмулирование), выясним достоинства, недостатки и области применения такого подхода, а также связанные с ним изменения семантики данных.

Много внимания будет уделено атрибутам смыслов, реализация которых может существенно расширить объём семантики, хранимой в базе. Мы классифицируем смыслы и опишем их реализации с помощью препроцессоров в обычных СУБД, а также предложим несложные изменения, которые необходимо внести в СУБД, чтобы получить возможность работы со смыслами.

Существуют предметные области, в которых природа данных требует использования в рассуждениях неклассических логик – модальных логик веры, знания и др. В частности, темпоральные данные могут рассматриваться как особая система смыслов, может быть, требующая использования модальных темпоральных логик.

Встраивание дедуктивных систем в обычные СУБД позволяет наряду с табличными и объектными моделями использовать вспомогательные дедуктивные модели, основанные на классической логике и, может быть, модальных логиках.

Как далеко следует заходить в насыщении базы данных семантикой? Всё зависит от того, имеется ли необходимая информация, насколько нужна семантика, что позволит сделать используемая СУБД и имеющиеся в распоряжении дополнительные программные средства, что даёт использования внешних источников семантики, например, онтологий, и от возможностей второго слоя СУБД.

В предыдущих главах значения, хранящиеся в базе, предполагались атомарными. С точки зрения отображаемой модели бизнеса они могли быть сколько угодно сложными, но рамках использованной модели данных работать с их компонентами нельзя. В базах данных давно используются модели, которые мы будем называть двухслойными. Роль первого слоя выполняет любая модель данных, для которой организованы структуры хранения данных. Второй слой работает с данными, которые ему предоставляет первый слой, но данные в нём считаются не атомарными, а известным образом организованными. Практически во всех СУБД во втором слое применяются регулярные выражения и/или различные виды XML данных. Понятно, что второй слой не влияет на структуры хранения данных непосредственно, но может предъявлять свои требования к их организации.

Вторая возможность расширения обычных моделей данных связана с хранением дополнительной семантики данных. Можно учесть особенности использования атрибутов, выделяя их разновидности – сорта. Дальше мы отметим, что сущности с обычными (обязательными) атрибутами определяют замкнутые и статические объекты. Сущности с атрибутами других сортов могут быть открытыми и динамическими.

Изучению семантики данных в базах данных препятствует некоторая недовыясненность сути предмета, отсутствие единых признанных подходов и терминологическая путаница. Определенные затруднения вызывает увеличение количества предметных областей, с которыми необходимо работать, и неизбежное усиление роли лингвистического аспекта.

Полезно заимствовать опыт тех областей знания, в которых давно занимаются семантикой. Это лингвистика, исследующаяся естественные языки (ЕЯ), и теория языков программирования.

Прежде всего, отметим несоответствие некоторых терминов в лингвистике и информатике. Лингвисты выделяют два противопоставляемых вида элементов семантики – значения и смыслы. Значение лингвистического знака понимается как нечто стабильное, что можно сначала установить, выяснить, а затем знать. Смысл приходится всё время искать, устанавливать, разгадывать. В информатике термин ”значение” уже занят. Говоря ”переменная имеет значение” подразумеваем не семантику этой переменной, а присваивание ей конкретного экземпляра данных, или означивание, или создание экземпляра переменной, содержащего этот элемент данных. Поэтому элементы семантики мы всегда будем называть смыслами, а ”стабильность” или “контекстность” или “вариативность” смыслов будем задавать через классификацию смыслов или вводя в них дополнительные свойства.

Давно известно, что значения и смыслы -- это внеязыковые сущности. В частности, для перевода с одного естественного языка на другой ЕЯ может создаваться специальный язык функций для представления семантики, в который транслируются фразы исходного языка. А уже с этого промежуточного языка осуществляется трансляция на второй ЕЯ. Тезис о внеязыковой природе смыслов мы трансформируем для баз данных в несколько смягчённую форму как утверждение о возможности разделения данных и смыслов.

В языках программирования обратим внимание на возможность выделения нескольких видов семантики: операционной (описывается в терминах перехода состояний некоторой абстрактной машины), денотационной (в языке для представления семантики используются математические структуры, позволяющие установить возможность вычисления конструкций языка посредством специализированных функций), дедуктивной (позволяет доказывать свойства программ, в первую очередь их правильность), трансляционной (использует правила перевода на язык, семантика которого известна), основанной на таблицах решений и т.д.

Вернемся к терминологии баз данных. Существует безосновательная, но устойчивая традиция выделять некоторые модели и базы данных как семантические (и мы тут не без греха). Так модель «сущность-связь» считается семантической моделью, по-видимому, по сравнению с табличными моделями данных. Однако, семантика, обычно ограниченная, есть в любых моделях данных. Поэтому, еще в 1988 году Э. Кодд отметил, что “ярлык “семантическое” не должен интерпретироваться в каком-либо абсолютном смысле”. В тех же табличных базах семантику определяют, в частности, ключи и ограничения целостности. В базах данных с декларативными языками всегда реализуется операционная семантика, представляемая, например, планами исполнения SQL. Так что следует говорить только о большей или меньшей насыщенности моделей и баз данных семантикой.

Как же отделить элементы семантики, хранимые в базе, от обычных данных? По очень простому признаку: элементы семантики, они же смыслы, обладают активностью. Данные всегда пассивны.

Поясним сказанное на простом примере. Пусть, необходимо выбрать все записи из таблицы, например, инструкцией SELECT * FROM emp. Очевидно, СУБД должна сначала проверить существование таблицы emp по словарю и, может быть, установить, имеются ли у действующего пользователя необходимые права на эту таблицу. Если таблица не существует или недоступна, выдать сообщение об ошибке. В противном случае, установить список столбцов emp и только после этого приступить к выборке данных. Как много делается того, что прямо не было указано! Всё это обеспечивает активность, которой обладают метаданные.

Ещё один пример. Пусть мы вставляем строку в таблицу, имеющую первичный ключ. Поскольку ограничение ”первичный ключ” активно, СУБД сначала проверит уникальность вводимого значения ключа, и только если это условие выполнено, сделает то, что ей приказали – введёт запись.

Заметим, что активность смыслов выводит модели данных со смыслами за рамки обычных чисто алгебраических моделей данных.

В следующих разделах мы постараемся ответить на вопрос о том, какие смыслы, кроме перечисленных выше, можно хранить в базах данных и как это сделать. Но сначала уточним, какие виды сущностей могут храниться в базах данных.

§ 1. Понятие и основные модели перевода

Модель перевода – это теоретический конструкт, алгоритм, описывающий деятельность переводчика в процессе перевода.

Основные модели:

трансформационно-семантическая

денотативно-ситуативная

коммуникативная

Трансформационносемантическая:

два это преобразованиеварианта объектовмодели и структур одного языка в

объекты и структуры другого по определенным правилам, т.е. с использованием разных видов

соответствий и трансформаций, без обращения к внеязыковой действительности (Л.С. Бархударов).

преобразование по правилам внутриязыковых трансформаций 1)структур ИЯ для обеспечения прямого перевода на ПЯ; или 2)пословного перевода на ПЯ с

целью получения идиоматичного грамотного перевода на ПЯ (О.И. Бродович, А.Д. Швейцер)

Переведите:

Before the invention of fashion in 1350 A.D., tailors were unnecessary: Clothing didn"tacknowledge the body"s shape.

Mosquitoes are attracted to the color blue twice as much as to any other color.

Разновидности модели, построенные на различных

теориях 1) Порождающая грамматика:языка теория

постулирует наличие у человека некоей языковой способности, состоящей из знания базовых структур языка и правил их преобразования в поверхностные.

Для английского языка характерны 6 ядерных/базовых структур: NV

There (be) N (D) N be N

при построении речевых высказываний т.н. ядерные предложения преобразуются (трансформируются) в поверхностные путем

преобразования синтаксической структуры одного предложения:

John sent Bill a letter. ↔ The letter was sent to bill by John.

или соединения нескольких ядерных с возможным опущением элементов или с использованием слов-заменителей

Having sent a letter to Bill, John went home.

Схема модели перевода, построенной на основе порождающей грамматики

Преимущества и

недостатки требует минимального привлечениямодели внелингвистических знаний для интерпретации языковых структур

позволяет сократить все многообразие языка до нескольких базовых структур.

позволяет привести два языка к семантическому “общему знаменателю”

на стадии анализа ИТ они помогают снять неоднозначность, поскольку ядерные структуры однозначны, т.к. эксплицируют смысловую структуру

poor worker (х-ка лица или процесса?)

television channel award (субъект или объект действия?)the foundation of the school (процесс или предмет?)

на стадии синтеза позволяют преодолеть такие проблемы как:

1) отсутствие соответствующей морфологической формы в ПЯ (герундий – His handling the millitary operation appears to be lax ← It apperaed that he handled … Создается впечатление, что военной операцией он руководил нечетко.

2) невозможность передать словообразовательное значение слова морфологическим способом ( the rent raiser, disturber )

3) различия в лексической сочетаемости ( She spoke about the waste of human resources ).

4) для сохранения тема-рематического членения или когда русское предложение начинается с косвенного дополнения (Американцам внушают, что… - Americans have been led to believe that…) и др.

2) Компонентный

анализ: значения всех словтеория во всех языках могут быть описаны с помощью одного и того же ограниченного набора из нескольких десятков элементов –семантических примитивов , соответствующих значениям слов,

предположительно встречающихся в любом языке и составляющих его понятийную основу (напр., "я", "ты", "кто-то", "что-то", "люди", "думать", "говорить", "знать", "чувствовать", "хотеть‘)

Семы делятся на три вида: общие, дифференциальные и дополнительные . Общие семы – те компоненты, которые объединяют все лексико-семантические варианты одного слова или синонимы одного синонимического ряда (напр.,give во всех значениях - это let+have ); дифференциальные – те компоненты, кот. обеспечивают включение рассматриваемых ЛСВ в разные синонимические ряды (дарить – «безвозмездность», покупать «брать за деньги»); дополнительные – те несущественные для логикопредметного значения элементы значения, которые часто служат базой для метафорического/метонимического переноса.

Схема модели, основанной на теории компонентного

Преимущества и недостатки модели

позволяет учитывать расхождения в компонентной структуре слов и конфигурациях семантических полей в двух языках при выборе соответствующей единицы ПЯ

В sibling по сравнению сбрат, сестра отсутствует сема «пол»

В рисунок (неспец.) по сравнению сdrawing отсутствует сема «карандашом»

Свояченица, золовка (сестра мужа/жены) – sister-in-law

объясняет случаи конкретизации значения исходной единицы ввиду разницы в конфигурации семантических полей

purple – any colour between red and blue: в переводе фиолетовый, лиловый, сиреневый.

BUT! не раскрывает механизма синтаксических и лексикосинтаксических преобразований

3) Семантическая модель «смысл↔текст»

стремится отразить закономерности преобразования смысла в текст и обратно.

Глубинная структура языка представляет собой не только глубинный синтаксис (как у Хомского), но и глубинную лексику.

Глубинная лексика включает лишь самостоятельные (первичные слова), а

остальное интерпретируется в терминах лексических функций, которые делятся на две категории: эквивалентные замены (синонимы, конверсивы типа «дать-получить», синтаксические дериваты) исемантические параметры ,выражающие некоторые элементарные смыслы при ключевом слове :

Oper1 (типовая ситуация, присоединитель субъекта в роли подлежащего) – задать при вопрос, сделать при шаг;

Oper2 (присоединитель объекта в роли подлежащего) – подвергнуться нападению, понести наказание.

Inctp – начинаться (вспыхнуть, подниматься), Fin – заканчиваться (улеглась, отошла),

Magn - высокая степень – (грубая ошибка, жгучий брюнет).

Строгого, единого определения для понятия «система» в настоящее время нет. В качестве «рабочего» определения в литературе под системой в общем случае понимается совокупность элементов и связей между ними, обладающая определенной целостностью.

Рассматривая систему относительно построения ИС, более полно это определение можно пояснить на основе понятия модели.

Пусть А и В - два произвольных множества. Функция f, однозначно ставящая в соответствие каждому элементу элемент f(а) В, называется отображением множества А в множество В и обозначается как f: АВ.

Элемент f(а)=b называется значением элемента а при отображении f, или образом а; А - область определения, В - область значений отображения f.

Если есть элементы , не являющиеся образом никакихэлементов , то отображение f называется отображением «в» в В.

Если f(А) = В, то отображение f называется отображением «на» В.

Функция - множество элементов из А, образы которых принадлежат В, называется прообразом множества В, то есть

В общем случае может не быть отображением «в» или «на» А, так как функция может быть неоднозначной.

Отображение f называется взаимно однозначным, если каждый элемент множества В является образом не более чем одного элемента из А. Отображение f множества А на (в) В называется гомоморфизмом множеств, если выполняется условие (а 1 , а 2 , ... , a n) f (а 1 ,), f (а 2 ,) f (а 3 ,) f (а 4 ,) ..... f (а n ,), где

Изоморфизм множества А на В является взаимно однозначным гомоморфизмом, т. е. (a 1 , а 2 ,.. , a k) А <=> (f (а 1 ,) f (а 2)..,

Введенные понятия позволяют определить модель как изоморфизм А в , где А - множество фиксированных элементов предметной области с исследуемыми связями, отношениями между этими элементами, - абстрактное множество, задаваемое кортежем

=<{M}, P 1 ,Р 2 ,…, Р n > , (1)

{M} – множество элементов модели, соответствующих элементам предметной области, называемое носителем модели;

Р 1 , Р 2 ,..., Р n - предикаты, отображающие наличие того или иного отношения между элементами предметной области.

Предикат - это логическая п-я пропозициональная функция, определенная для предметной области и принимающая значения либо истинности, либо ложности.

Носитель модели является содержательной областью предикатов Р 1, Р 2 ,...,Р n . Предикаты называются сигнатурой модели .

Выбор носителя и сигнатуры при построении модели определяется предметом исследования.

Уточним теперь понятие системы, ориентированное на задачи декомпозиции, анализа и синтеза, то есть на проведение преобразования между двумя подмоделями.

Системой называется кортеж

S = < >. (2)

Подмодель, определяющая поведение системы. Иногда эта подмодель может рассматриваться как «черный ящик», о котором известно лишь то, что на определенные воздействия он реагирует определенным образом;

Подмодель, определяющая структуру системы при ее внутреннем рассмотрении;

Предикат целостности, определяющий назначение системы, семантику (смысл) моделей и , а также семантику преобразования

1, если преобразование существует при взаимно однозначном соответствии между элементами носителей моделей и , в противном случае = 0. Наличие предиката целостности позволяет говорить о том, что система - это семантическая модель, имеющая внутреннюю интерпретацию.

Подмодель может быть представлена в виде кортежа, включающего пять объектов:

х = x(t) - входной сигнал, то есть конечное множество функций времени t: <х 0 (0, ..., x k (t)>;

у = y(t) - выходной сигнал, представляющий собой конечное множество функций у = < y 1 ..., у n >;

z= z(t) - переменная состояния модели , также характеризующаяся конечным множеством функций z= < z 1 (t)…z n (t) >, знание которых в заданный момент времени позволяет определить значения выходных характеристик модели – функционалы (глобальные уравнения системы), задающие текущие значения выходного сигнала у(t) и внутреннего состояния z(t)

y(t) = g(z(t),x(t)); (4)

z(t) = f(z(t 0), x(τ)), τ . (5)

Соотношения (4) и (5) называют уравнением наблюдения и уравнением состояния системы соответственно. Если в описание системы введены функционалы f и g, то она уже не рассматривается как «черный ящик». Однако для многих систем определение глобальных уравнений оказывается делом трудным и зачастую даже невозможным, что и объясняет необходимость использования этого термина.

Кроме выражения (2) систему задают тремя аксиомами.

Аксиома 1. Для системы определены пространство состояний Z, в которых может находиться система, и параметрическое пространство Т, в котором задано поведение системы.

В связи с этим математические описания вида (3) принято называть динамическими системами, так как они отражают способность систем изменять состояния z (t) в параметрическом пространстве Т.

В отличие от динамических статические системы таким свойством не обладают. В качестве параметрического пространства обычно рассматривается временной интервал от нуля до бесконечности.

Аксиома 2 . Пространство состояний Z содержит не менее двух элементов. Эта аксиома отражает естественное представление о том, что сложная система может находиться в разных состояниях.

Аксиома 3 . Система обладает свойством функциональной эмерджентности.

Эмерджентностъ (целостность) - это такое свойство системы S, которое принципиально не сводится к сумме свойств элементов, составляющих систему, и не выводится из них:

где: - i-я характеристика системы S; т - общее количество характеристик.

При таком рассмотрении система является совокупностью моделей и, главное, отражает семантику предметной области в отличие от не интерпретированных частных математических моделей. Другими словами, система - это совокупность взаимосвязанных элементов, обладающая интегративными свойствами (эмерджентностью), а также способ отображения реальных объектов.

В рамках изучаемой дисциплины под сложной кибернетической системой понимается реальный объект с управлением и его отображение в сознании исследователя как совокупность моделей, адекватная решаемой задаче.

Упражнения

1. Опишите в виде черного ящика известный Вам бытовой прибор.

2. Рассмотрите примеры функционирования известной Вам системы.

3. Докажите системность дерева, Солнечной системы, озера и других объектов.

Литература:

1. Богданов А.А. Всеобщая организационная наука (тектология)/ в 3 т. - М., 1905-1924

2. Винер Н. Кибернетика. М.: Сов. радио. 1968.

3. Пригожин И., Стенгерс И. Порядок из хаоса. М.: Прогресс, 1986.

4. Уемов А.И. Системный подход и общая теория систем. М.: Мысль, 1978

5. Шэннон Р. Имитационное моделирование систем искусство и наука. М.: Мир, 1978