Разница между знанием и информацией. Знания в системах ии

Понятие, структура, классификация, особенности интеллектуальных систем.

Система называется интеллектуальной, если в ней реализованы 3 базовые функции:

1. Представление и обработка знаний.

2. Рассуждение.

3. Общение.

Пользователь


Функциональные механизмы База знаний

Структурные знания – знания об операционной среде. Метознания – знания о свойствах знаний.

1. Биохимическое (все, что связано с мозгом);

2. Программно-прагматическое направление (написание программ, заменяющих функции).

1. Локальный (задачный) подход: для каждой задачи специальные программы, достигающие результаты не хуже человека.

2. Системный подход, основанный на знаниях –создание средств автоматизации, создание самих программ.

3. Подход использующий метод процедурного программирования – создание алгоритмов на естественных языках.

Основные разделы ИИТ:

1. Управление знаниями.

2. Формальные языки и семантика.

3. Квантовая семантика.

4. Когнитивное моделирование.

5. Конвергентные (сходящиеся) системы поддержки решений.

6. Эволюционные генетические алгоритмы.

7. Нейронные сети.

8. Муравьиные и иммунные алгоритмы.

9. Экспертные системы.

10. Нечеткие множества и вычисления.

11. Немонотонные логики.

12. Активные многоагентные системы.

13. Естественное языковое общение и перевод.

14. Распознавание образов, игра в шахматы.

Характеристики проблемных областей, где необходимо применение ИИС:

1. Качество и оперативность принятия решений.

2. Нечеткость целей.

3. Хаотичность, флюктуируемость и квантованность поведения среды.

4. Множественность взаимозаменяющих друг на друга факторов.

5. Слабая формализуемость.

6. Уникальность (нестереотипность) ситуации.

7. Латентность (скрытость) информации.

8. Девиантность реализации планов, а так же значимость малых действий.

9. Парадоксальность логики решений.

Неустойчивость, нецеленаправленность, хаотичность среды


Понятие данных, информации и знаний. Свойства знаний и отличие их от данных.

Информация – это:

· любые сведения, принимаемые и передаваемые, сохраняемые различными источниками;

· это вся совокупность сведений об окружающем нас мире, о всевозможных протекающих в нем процессах, которые могут быть восприняты живыми организмами, электронными машинами и другими информационными системами;

· это значимые сведения о чём-либо, когда форма их представления также является информацией, то есть имеет форматирующую функцию в соответствии с собственной природой;

· это все то, чем могут быть дополнены наши знания и предположения.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

· исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

· представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

· базы данных на машинных носителях информации.

Знание - в теории искусственного интеллекта и экспертных систем - совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений. Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Для того чтобы поместить знания в информационную систему, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. Поэтому при разработке информационной системы сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ.

Знания в ИС существуют в следующих формах:

· исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);

· описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов и т. п.);

· представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

· базы знаний на машинных носителях информации.

Знания являются более сложной категорией по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания получаются в результате применения к исходным данным некоторых методов обработки, подключения внешних процедур.

ДАННЫЕ + ПРОЦЕДУРА ОБРАБОТКИ = ИНФОРМАЦИЯ

ИНФОРМАЦИЯ + ПРОЦЕДУРА ОБРАБОТКИ = ЗНАНИЯ

Характерная особенность знаний состоит в том, что они не содержаться в исходной системе. Знания возникают в результате сопоставления информационных единиц, нахождения и разрешения противоречий между ними, т.е. знания активны их появление или недостача приводит к реализации некоторых действий или появлению новых знания. Знания отличаются от данных наличием следующих свойств.

Свойства знаний (из лекций):

· Внутренняя интерпритируемость (данные+методанные). Методанные -структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими

· Наличие связей (внутренних, внешних), структура связи

· Возможность шкалирования (оценка соотношения между информационными единицами) – количественная

· Наличие семантической метрики (средства оценки плохо формализуемых информационных единиц)

· Наличие активности (неполнота, неточность побуждает их к развитию, пополнению).


Классификация знаний

Знание – форма существования и систематизации результатов познавательной деятельности человека. Знание помогает людям рационально организовывать свою деятельность и решать различные проблемы, возникающие в её процессе.

Знание (в теории искусственного интеллекта и экспертных систем) – совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений.

Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Выделяют различные виды знания:

Научное,

Вненаучное,

Обыденно-практическое (обыденное, здравый смысл),

Интуитивное,

Религиозное, и др.

Обыденно-практическое знание носит несистемный, бездоказательный, бесписьменный характер. Обыденное знание служит основой ориентации человека в окружающем мире, основой его повседневного поведения и предвидения, но обычно содержит ошибки, противоречия. Научное знание, основанное на рациональности, характеризуется объективностью и универсальностью, и претендует на общезначимость. Его задача – описать, объяснить и предсказать процесс и явление действительности. Вненаучное знание продуцируется определённым интеллектуальным сообществом по отличным от рационалистических нормам, эталонам, имеют свои источники и средства познания.

Классификация знаний

I. по природе. Знания могут быть декларативные и процедурные .

Декларативные знания содержат в себе лишь представление о структуре неких понятий. Эти знания приближены к данным, фактам. Например: высшее учебное заведение есть совокупность факультетов, а каждый факультет, в свою очередь, есть совокупность кафедр. Процедурные же знания имеют активную природу. Они определяют представления о средствах и путях получения новых знаний, проверки знаний. Это алгоритмы разного рода. Например: метод мозгового штурма для поиска новых идей.

II. по степени научности. Знания могут быть научными и вненаучными .Научные знания могут быть:

1) эмпирическими (на основе опыта или наблюдения);

2) теоретическими (на основе анализа абстрактных моделей, аналогий, схем, отображающих структуру и природу процессов, т.е. обобщение эмпирических данных).

Вненаучные знания могут быть:

 паранаучными знаниями – учения или размышления о феноменах, объяснение которых не является убедительным с точки зрения критериев научности.

 лженаучными – сознательно эксплуатирующие домыслы и предрассудки.

 квазинаучными – они ищут себе сторонников и приверженцев, опираясь на методы насилия и принуждения. Квазинаучное знание, как правило, расцветает в условиях строго иерархированной науки, где невозможна критика власть предержащих, где жестко проявлен идеологический режим. (В истории России периоды «триумфа квазинауки» хорошо известны: лысенковщина; фиксизм, и т.д.)

 антинаучными – как утопичные и сознательно искажающие представления о действительности.

 псевдонаучными – представляют собой интеллектуальную активность, спекулирующую на совокупности популярных теорий (истории о древних астронавтах, о снежном человеке, о чудовище из озера Лох-Несс)

 обыденно-практическими – доставлявшими элементарные сведения о природе и окружающей действительности. Обыденное знание включает в себя и здравый смысл, и приметы, и назидания, и рецепты, и личный опыт, и традиции. Оно хотя и фиксирует истину, но делает это не систематично и бездоказательно.

 личностными – зависящими от способностей того или иного субъекта и от особенностей его интеллектуальной познавательной деятельности. Коллективное же знание общезначимо (надличностно), предполагает наличие общей для всей системы понятий, способов, приёмов и правил построения. III. по местонахождению

Выделяют личностные (неявные, скрытые, пока неформализованные) знания и формализованные (явные) знания.

Неявные знания – знания людей, которые ещё не формализованы и не могут быть переданы другим людям.

Формализованные на некотором языке (явные) знания:

 знания в документах;

 знания на компакт-дисках;

 знания в персональных компьютерах;

 знания в Интернете;

 знания в базах знаний;

 знания в экспертных системах, извлечённые из неявных знаний людей-экспертов.

Отличительные характеристики знания все ещё являются предметом неопределённости в философии. Согласно большинству мыслителей, для того чтобы нечто считалось знанием, это нечто должно удовлетворять трем критериям:

a) быть подтверждаемым,

b) быть истинным,

c) заслуживающим доверия.


Похожая информация.


Знания в современных компаниях

Компания "Ксерокс" в последние годы позиционирует себя не как производитель копировальных аппаратов, а как компания по обработке документов. Компания "ЗМ" называет себя компаний по инновационному решению задач. "ИБМ" идентифицирует себя как компания, создающая долгосрочные экономические преимущества для клиентов, объединяя свои знания в области бизнеса с широкими технологическими возможностями. Компания Steelcase, которая производит конторское оборудование, утверждает, что она продает собственные знания и услуги, которые позволяют создать лучшие условия пребывания людей на своих рабочих местах. Что добавляет стоимость в деятельность всех этих компаний? Это в основном решения, базирующиеся на знаниях: технические и технологические ноу-хау, дизайн продукта, маркетинговые исследования, выявление истинных нужд клиентов. Именно знания дают устойчивое конкурентное преимущество этим компаниям.

Рассмотрим, в чем отличие знаний от данных и информации. То, что это разные вещи, руководители начинают осознавать особенно ярко после того, как в организации потрачены значительные средства для создания той или иной базы данных, или информационной системы, или же просто эти средства потрачены на компьютеризацию, причем без соответствующего эффекта.

Данные - это совокупность различных объективных фактов. В корпорациях это, например, структурированные записи о трансакциях (в частности, данные обо всех продажах: сколько, когда и кто купил, сколько и когда заплатил и пр.). Эти данные не говорят о том, почему покупатель пришел именно сюда и придет ли он еще раз.

Информация - это иерархическая совокупность данных о тех или иных аспектах реального мира. Информация - это поток сообщений, а знание создается из этого потока, оно находится в зависимости от мнений и убеждений носителя знания.

Информация - это своего рода послание, обычно в форме документа или в видео- либо в аудиоформе. Она имеет получателя и отправителя. Она информирует, т.е. "придает форму", получателю путем изменения его оценок или поведения. Насколько послание является информацией, определяет получатель. Именно он оценивает, насколько полученное сообщение информирует его, а насколько оно представляет собой просто информационный шум.

Данные превращаются в информацию несколькими путями:

  • o контекстуализация : мы знаем, для чего эти данные нужны;
  • o категоризация : мы разбиваем данные на типы и компоненты;
  • o подсчет : мы обрабатываем данные математически;
  • o коррекция : мы исправляем ошибки и ликвидируем пропуски;
  • o сжатие : мы сжимаем, концентрируем, агрегируем данные.

Знания - понятие более глубокое и широкое, чем просто данные или информация. Каждое предприятие в ходе своей деятельности осуществляет сбор данных, их структуризацию и генерирование нового знания. Чаще всего это знание касается технологии, если речь идет о материальном производстве, а также технологии работы с клиентами и технологии взаимодействия друг с другом, если речь идет о предприятии, осуществляющем обслуживание клиентов. Также это может быть знание относительно окружающей среды предприятия - о демографических, макроэкономических, социальных, макроэкономических, технологических и конъюнктурных трендах.

Отличие знаний от информации и данных: пример

У компании Chrysler имеется собрание компьютерных файлов, которые носят название "Книга инженерных знаний" и представляют собой исчерпывающие данные и информацию о создании автомобилей этой компании, которыми может пользоваться каждый разработчик новых автомобилей. Когда управляющий получил данные о проведенных крэш-тестах, то он отказался их поместить в файлы без соответствующей обработки. Он предложил ответить на следующие вопросы:

  • o почему эти тесты проводились;
  • o каковы результаты по сравнению другими аналогичными тестами данной компании других лет и конкурентов;
  • o какие выводы дачи тесты для конструкции автомобиля и его основных узлов?

Аналогичные вопросы трансформируют информацию в знания; более того, ответы на эти вопросы добавляют информации ценность, или, говоря другими словами, добавляют стоимость. На практике встречаются противоположные примеры, когда путем добавления ненужной, пустой информации исходная информация теряет в своей цене. Происходит потеря стоимости за счет размывания нужной информации в потоке информационного шума.

Знание - это комбинация опыта, ценностей, контекстной информации, экспертных оценок, которая дает общие рамки для оценки и инкорпорирования нового опыта и информации. Знание существует в сознании тех, кто знает. В организациях оно фиксируется не только в документах, но и в процессах, процедурах, нормах, в целом в практике деятельности.

Точно так же как информация возникает из данных, так и знания возникают из информации путем:

  • o сравнения, определения области применения (как и когда мы можем применить информацию об этом явлении к другому, аналогичному);
  • o установления связей (как эта информация соотносится с другой информацией);
  • o оценки (как можно оценить данную информацию и как ее оценивают другие);
  • o определения области применения (какое применение имеет эта информация к тем или иным решениям или действиям).

Процесс трансформации данных в информацию, а информации в знания показан на рис. 14.1.

Рис. 14.1.

Различают индивидуальные и групповые знания. Традиционные представления исходят из того, что знания - это прерогатива отдельных людей, при этом группа - это лишь простая сумма членов этой группы, а групповое знание - сумма их знаний.

Существует другая, современная точка зрения, в соответствии с которой группа людей формирует новую сущность со своей уникальной спецификой. В рамках этого представления можно говорить о групповом поведении и о групповом знании соответственно. Это новое представление широко используется в рамках науки об управлении знаниями. Таким образом, знание может быть не только у отдельного человека, но и у группы людей. Тогда говорят о том, что что-то знает организация в целом, что-то знает группа, бригада и т.д.

Билл Гейтс в своей книге "Бизнес со скоростью мысли" пишет о необходимости повышения корпоративного IQ. При этом он имеет в виду не только количество умных сотрудников, но и накопление знаний в компании в целом и свободное распространение информации, которое позволяет сотрудникам пользоваться идеями друг друга.

Знание может быть явным и неявным. Явное знание может быть выражено в виде слов и цифр и может передаваться в формализованном виде на носителях. Это относится к тем видам знаний, которые передаются в форме предписаний, инструкций, книг, на различных носителях, в виде памятных записок и пр.

Неявное знание в принципе не формализуется и может существовать лишь вместе с его обладателем - человеком или группой лиц.

Существует два вида неявного знания. Первое - это технические навыки, которые проявляются у мастеров своего дела и выступают, как правило, результатом многолетней практики. Второе - это верования, идеалы, ценности и ментальные модели, которые мы используем, не задумываясь о них.

Неявные знания формируются и развиваются в процессе создания и укрепления позитивной корпоративной культуры и с помощью средств группового взаимодействия (ретриты, творческие группы и пр.).

Отношение к явному и неявному знанию со стороны коммерческих фирм весьма противоречиво. С одной стороны, многие фирмы стремятся перевести неявное знание в явное. Это делается для того, чтобы, с одной стороны, не зависеть от отдельных личностей, а с другой - продублировать значимые достижения. В то же время эти фирмы не заинтересованы в том, чтобы основные конкурентные преимущества перешли в форму, готовую для дублирования. Именно поэтому многие компании стараются сохранять некоторые из своих конкурентных преимуществ в тех формах, которые не поддаются дублированию (специфические тренинги, корпоративная культура, специальные системы обслуживания и пр.).

Носителем как явного, так и неявного знания может быть не только конкретная личность, но и организация . Следовательно, можно говорить и о неявном групповом знании, которое лежит в основе устойчивых моделей коллективных реакций и внутренних взаимодействий.

В западной литературе для обозначения неявного группового знания иногда используется термин "рутины" (routines), которые есть повторяющиеся по шаблону действия, регулярные поведенческие шаблоны организации или фирмы. Рутины - это то, что происходит автоматически, без инструкций и в отсутствие процедуры выбора; при этом рутины не могут быть кодифицированы.

В русском языке под рутиной понимаются заведенный порядок, установившаяся практика, определенный режим, шаблон, сложившиеся правила, касающиеся занятий людей. В то же время понятие "рутина" имеет еще один опенок: это косный порядок, т.е. такой порядок, который тяготеет к старому, привычному, в силу своей отсталости невосприимчивый к новому, прогрессивному. В тех случаях, когда термин "рутина" применяется для обозначения группового неявного знания, то оттенки, относящиеся к косности, отсутствуют.

Таким образом, персональное неявное знание - это, прежде всего, умения. В то же время групповое неявное знание - это, прежде всего, рутины. Рутины существуют не изолированно, а образуя взаимозависимость. Некоторые рутины могут быть неявными для одних членов группы (организации) и явными для других. Таким образом, границы между явными и неявными знаниями относительны, также можно говорить о степени неявности этих знаний. Соотношение явных и неявных, индивидуальных и групповых знаний представлено в табл. 14.1.

Таблица 14.1

Соотношение знаний

Наличие неявных знаний в организации заставляет подходить к управлению знаниями нетрадиционным способом. Традиционно под управлением знаниями понимают создание, развитие и использование различных баз данных и знаний. Наличие неявных знаний смещает внимание к средствам прямого общения между людьми. Важно не только и не столько создать корпоративную энциклопедию, в которой записано все, что кто-либо из работников знал и с чем сталкивался. В случае с неявными знаниями важнее иметь под рукой координаты людей, которые знают рецепт и имеют соответствующий опыт, создать культуру общения, используя "мозговые штурмы", совещания, "разборы полетов" и соответствующие средства общения, такие как электронная почта, персональные сайты, телеконференции и пр.

При изучении интеллектуальных систем традиционно возникает вопрос - что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным.

Данные - это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

1. данные как результат измерений и наблюдений;

2. данные на материальных носителях информации (таблицы, протоколы, справочники);

3. модели (структуры) данных в виде диаграмм, графиков, функций;

4. данные в компьютере на языке описания данных;

5. базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

При обработке на ЭВМ знания трансформируются аналогично данным.

1. знания в памяти человека как результат мышления;

2. материальные носители знаний (учебники, методические пособия);

3. поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;

4. знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы - см. далее);

5. база знаний на машинных носителях информации.

Часто используется такое определение знаний:

Знания - это хорошо структурированные данные, или данные о данных, или метаданные.

В базе данных идёт поиск по ключевому слову, условно говоря – это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 – 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей – это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение – что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая – по способам подачи материала (насосы, окунание детали, распыление раствора), третья – по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний – это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.



Теперь немного о минусах этой системы. Базы данных – это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус – базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний – это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс – при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов – до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.

Применение баз знаний

Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз - помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.

Системы основанные на знаниях реализуются на базе следующих интеллектуальных алгоритмов:

  • экспертные системы;
  • нейронные сети;
  • нечёткая логика;
  • генетические алгоритмы.

База знаний учебного назначения представляет собой информационную систему, содержащую, во-первых, систематизированные сведения из определенной предметной области, во-вторых, модель конкретной предметной области (определенный объем учебной информации по этой дисциплине), а также данные о формируемых умениях обучаемого и способах использования этих умений.

Учебная информация в базах знаний может быть представлена в виде текста, графиков, иллюстраций, анимационных роликов, видеофрагментов. Данные о формируемых умениях обучаемого обрабатываются в системе управления базами знаний с помощью

специальных языков, что позволяет контролировать процесс обучения и управлять им. По своим возможностям базы знаний представляют собой упрощенный вариант экспертной обучающей системы или ее часть.

Заключение

Зарубежная научная стажировка в ИТМО на кафедре «Прикладного программирования и технологических инноваций» мне очень понравился. Я узнала много интересного в области интелектуальой системы и базы знаний. Выполнял реферат на тему: Переход от базы данных до базы знаний(рис.-7). Общалась с людьми, работающими в области программирования уже много лет и приобрела опыт, который поможет мне в дальнейшем изучении своей диссертационной работе. Научная зарубежная стажировка позволила мне увидеть пропуски в моих знаниях, которые следует восполнить. В ходе прохождения стажировки был ознакомлен с нормативными документами по организации учебного процесса. Ознакомилась с каталогами диссертационных исследований магистрантов, кандидатов, изучила выпускные квалификационные работы, авторефераты, диссертации на соискание ученной степени кандидатов наук по теме магистерской работы.

В ходе практики были приобретены новые знания об особенностях процессов производства на машиностроительном предприятии ОАО НКМЗ. Была разработана блок-схема для моделирования программы, реализация которой осуществляется для определения оптимального количества транспортных тележек с учетом анализа экономической целесообразности разных вариантов закрепления тележек за станками.

Задача описанной блок-схемой модели состоит в необходимости подобрать такое количество тележек, которые перевозили бы готовые узлы на склад с учетом оптимального плана загрузки.

Полученные результаты представляют большой интерес и практическую полезность в перспективе применения их в будущем.

Участвовала в экскурсии по городу. Ознакомился с достопримечательностями города, памятниками, историей города. Также посещал главный музей города «Эрмитаж».

В целом хочется сделать вывод, что зарубежная стажировка была пройдена успешно. итогом продуктивно проделанной работы стал целый блок материалов из фондов хранилищ российских библиотек(рис.-3), собраннй по теме магистерской диссертации. Данный материал активно используется в написании научной работе, конечном итогом который явится магистерская диссертация.По завершению стажировки нам вручили сертификаты об успешном прохождении зарубежной практики в ИТМО. (рис.-4,5)

Список литературы

1. http://innovatika.boom.ru/UZ.htm

На сайте выложена первая глава книги В. П. Баранчеева «Управление знаниями». В. П. Баранчеев – доктор экономических наук, профессор Государственного университета управления (Институт инноватики и логистики, кафедра инновационного менеджмента). В книге рассматриваются современные концепции управления знаниями, неформализованное и формализованное знание, а также базы знаний.

2. http://www.knowbase.ru/

Сайт, посвященный базам данных. На странице вводятся понятия знаний, информации, управление знаниями, познание и т.д. Также описаны некоторые возможности баз знаний, а также рассказывается об их практическом применении и проблемах, связанных с их использованием. Каждому понятию отведена отдельная веб-страница.

3. http://lingvoworks.org.ua/index.php?option=com_content&view=article&id=57:2009-12-09-11-34-05&catid=2:misc&Itemid=3

В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.

4. http://aimatrix.nm.ru/aimatrix/SemanticNetworks.htm

Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.

5. http://bibl.tikva.ru/base/B1253/B1253Part12-59.php

Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.

6. http://lsdis.cs.uga.edu/projects/glycomics/report/Report2006.html

Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.

7. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.41.1007

Приложение

рис.1- Университет ИТМО

рис.2- Первый день в университете. Ознакомление

рис.3- В очень богатой библиотеке

рис.4- Вручение сертификатов о успешном прохождении зарубежной стажировки. Наш руководитель Супрун Антон Сергеевич.

рис.5- Сертификат

рис.6-Эксурсия по городу. Эрмитаж. Зимний дворец.

рис.7- Готовим презентации для защиты

рис.8-Экскурсия. Ночной город. Развод мостов.

Все знают, что такое базы данных и как ими пользоваться. Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое образование постепенно начинает терять свою былую значимость. Особенно это касается научной периодики. Главная проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём главное отличие баз данных и баз знаний? В базе данных идёт поиск по ключевому слову, условно говоря - это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 - 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей - это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение - что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая - по способам подачи материала (насосы, окунание детали, распыление раствора), третья - по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний - это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Теперь немного о минусах этой системы. Базы данных - это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус - базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний - это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс - при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов - до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Небольшой итог. Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.