Современные способы хранения информации

Информатика, кибернетика и программирование

Хранение информации данных не является самостоятельной фазой в информационном процессе а входит в состав фазы обработки. Различают структурированные данные в которых отражаются отдельные факты предметной области это основная форма представления данных в СУБД и неструктурированные произвольные по форме включающие и тексты и графику и прочие данные. Эта форма представления данных широко используется например в Интернеттехнологиях а сами данные предоставляются пользователю в виде отклика поисковыми системами. Организация того или...

PAGE \* MERGEFORMAT 3

Вопрос 2 . Хранение информации.

Хранение информации (данных) не является самостоятельной фазой в информационном процессе, а входит в состав фазы обработки. Однако, в силу важности организации хранения, данный материал вынесен в отдельный раздел.

Различают структурированные данные, в которых отражаются отдельные факты предметной области (это основная форма представления данных в СУБД), и неструктурированные, произвольные по форме, включающие и тексты, и графику, и прочие данные. Эта форма представления данных широко используется, например, в Интернет-технологиях, а сами данные предоставляются пользователю в виде отклика поисковыми системами.

Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к самим данным. Под доступом понимается возможность выделения элемента данных (или множества элементов) среди других элементов по каким-либо признакам с целью выполнения некоторых действий над элементом. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).

Для данных любого вида доступ осуществляется с помощью специальных данных, которые называются ключевыми (ключами ). Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в информационном массиве (массиве хранения данных).

Дальнейшее изложение фазы хранения информации относится к структурированным данным.

Модели структурированных данных и технологии их обработки основаны на одном из трех способов организации хранения данных: в виде линейного списка (или табличном), иерархическом (или древовидном), сетевом .

Хранение информации – это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии.

В результате реализации такого алгоритма, документ, независимо от формы представления, поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где он помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях:

Внешнем;

Концептуальном, (логическом);

Внутреннем;

Физическом.

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе реализации их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском – операцией, предполагающей извлечение хранимой информации.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней. Эти методы применяются для работы с файлами, графическими базами данных и т.д.

Рис. 1 Алгоритм процесса подготовки информации к хранению

Маркер – метка на носителе информации, обозначающая начало или конец данных либо их части (блока).

В современных носителях информации используются маркеры:

Адреса (адресный маркер) – код или физическая метка на дорожке диска, указывающие на начало адреса сектора;

Группы – маркер, указывающий начало или конец группы данных;

Дорожки (начала оборота) – отверстие на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.

Защиты – прямоугольный вырез на носителе (картонном пакете, конверте, магнитном диске), разрешающий выполнение любых операций над данными: запись, чтение, обновление, удаление и др.;

Конца файла – метка, используемая для указания окончания считывания последней записи файла;

Ленты (ленточный маркер) – управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;

Сегмента – специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого сегмента.

Хранение информации в ЭВМ связано как с процессом ее арифметической обработки, так и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив – упорядоченное множество данных.

Информационный массив – система хранения информации, включающая представление данных и связей между ними, т.е. принципы их организации.

Хранение информации осуществляется на специальных носителях. Исторически наиболее распространенным носителем информации была бумага, которая, однако, непригодна в обычных (не специальных) условиях для длительного хранения информации. Для ЭВТ по материалу изготовления различают следующие машинные носители: бумажные, металлические, пластмассовые, комбинированные и др.

По принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.

По методу считывания различают контактные, магнитные, электрические, оптические. Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе. Выделяют носители прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается следующими параметрами: временем доступа, емкостью памяти и плотностью записи.

Таким образом можно заключить, что хранение информации представляет процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

Хранение информации

Информация, закодированная с помощью естественных и формальных языков, а также информация в форме зрительных и звуковых образов хранится в памяти человека. Однако для долговременного хранения информации, ее накопления и передачи из поколения в поколение используются носители информации .

Материальная природа носителей информации может быть различной: молекулы ДНК, которые хранят генетическую информацию; бумага, на которой хранятся тексты и изображения; магнитная лента, на которой хранится звуковая информация; фото- и кинопленки, на которых хранится графическая информация; микросхемы памяти, магнитные и лазерные диски, на которых хранятся программы и данные в компьютере, и так далее.

По оценкам специалистов, объем информации, фиксируемой на различных носителях, превышает один эксабайт в год (10 18 байт/год). Примерно 80% всей этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20% - на аналоговых носителях (бумага, магнитные ленты, фото- и кинопленки). Если всю записанную в 2000 году информацию распределить на всех жителей планеты, то на каждого человека придется по 250 Мбайт, а для ее хранения потребуется 85 миллионов жестких магнитных дисков по 20 Гбайт.

Информационная емкость носителей информации. Носители информации характеризуются информационной емкостью, то есть количеством информации, которое они могут хранить. Наиболее информационно емкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 10 21 битов в 1 см 3 ), что дает возможность организму развиваться из одной-единственной клетки, содержащей всю необходимую генетическую информацию.

Современные микросхемы памяти позволяют хранить в 1 см 3 до 10 10 битов информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической эволюции.

Однако если сравнивать информационную емкость традиционных носителей информации (книг) и современных компьютерных носителей, то прогресс очевиден. На каждом гибком магнитном диске может храниться книга объемом около 600 страниц, а на жестком магнитном диске или DVD - целая библиотека, включающая десятки тысяч книг.

Надежность и долговременность хранения информации. Большое значение имеет надежность и долговременность хранения информации. Большую устойчивость к возможным повреждениям имеют молекулы ДНК, так как существует механизм обнаружения повреждений их структуры (мутаций) и самовосстановления.

Надежность (устойчивость к повреждениям) достаточно высока у аналоговых носителей, повреждение которых приводит к потери информации только на поврежденном участке. Поврежденная часть фотографии не лишает возможности видеть оставшуюся часть, повреждение участка магнитной ленты приводит лишь к временному пропаданию звука и так далее.

Цифровые носители гораздо более чувствительны к повреждениям, даже утеря одного бита данных на магнитном или оптическом диске может привести к невозможности считать файл, то есть к потере большого объема данных. Именно поэтому необходимо соблюдать правила эксплуатации и хранения цифровых носителей информации.

Наиболее долговременным носителем информации является молекула ДНК, которая в течение десятков тысяч лет (человек) и миллионов лет (некоторые живые организмы), сохраняет генетическую информацию данного вида.

Аналоговые носители способны сохранять информацию в течение тысяч лет (египетские папирусы и шумерские глиняные таблички), сотен лет (бумага) и десятков лет (магнитные ленты, фото- и кинопленки).

Цифровые носители появились сравнительно недавно и поэтому об их долговременности можно судить только по оценкам специалистов. По экспертным оценкам, при правильном хранении оптические носители способны хранить информацию сотни лет, а магнитные - десятки лет.

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, склада (хранилища) данных.

База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных - совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД - используют также термины Data Warehouse, «склад данных», «информационное хранилище») - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых - автоматическое; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных - множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользователей, «физическая память») имеет свое представление об информации

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность-связь», ER-модель, модель Чена), бинарные и инфологические модели, семантические сети).

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Структура базовой информационной технологии.

Определим структуру и состав типовой ИТ. Мы будем называть типовую ИТ базовой , если она ориентирована на определенную область применения. Базовая ИТ создает модели, методы средства решения задач. Базовая ИТ создается на основе базовых (типовых) аппаратно-программных средств. Базовая ИТ подчинена основной цели - решению функциональных задач в своей предметной области (задачи управления, проектирования, научного эксперимента, испытания и т. д.).

На вход базовой ИТ как системы поступает комплекс решаемых задач, для которых должны быть найдены типовые решения с помощью методов и средств, присущих именно ИТ. Рассмотрим использование базовой ИТ на концептуальном, логическом и физическом уровнях.

Концептуальный уровень базовой ИТ - задается идеология автоматизированного решения задач. Типовая последовательность решения задач может быть представлена в виде алгоритма.

Рис. 2 . Концептуальная модель базовой ИТ.

Начальный этап - постановка задачи (ПЗ). Если эта задача автоматизированного управления, то она представляет собой совокупность взаимосвязанных алгоритмов, которые обеспечивают управление. ПЗ - содержательное описание задачи: целевое назначение задачи, экономико-математическая модель и метод ее решения, функциональная и информационная взаимосвязь с другими задачами. Оформляется документально в методических материалах «Постановка задачи и алгоритм решения». На этом этапе очень важна корректность описания с точки зрения критериев.

Следующий этап - формализация задачи (ФЗ). Разрабатывается математическая модель.

Если математическая модель установлена, следующий этап - алгоритмизация задачи (АЗ). Алгоритм - процесс преобразования исходных данных в искомое результат за конечное число шагов.

Реализация алгоритма на основе конкретных вычислительных средств осуществляется на этапе программирования задачи - ПРЗ. Это объемная задача, но она осуществляется как правило на типовых технологиях программирования.

При наличии программы осуществляется РЗ - решение задач - получение конкретных результатов для входных данных и принятых ограничений.

Этап АР - анализ решения. При анализе решения можно уточнить модель формализации задач.

Наиболее сложными, творческими и объемными являются этапы постановки задачи и ее формализации. Понятие первоначальной задачи - это глубокое понимание процессов в предметной области.

В условиях базовой ИТ глобальная задача - это разработка модели предметной области (МПО).

При реализации ИТ часто встречаются с плохо формализуемыми задачами. Тут приходят на помощь экспертные системы. В основу ЭС закладываются знания лучших экспертов в предметной области. Разработчик ЭС собирает все известные способы формализации данной задачи. Пользователь - разработчик данной ИТ - получает варианты решения задач. Это процесс автоматизирования проектирования ИТ.

Логический уровень создания ИТ. Модели базовой ИТ

На логическом уровне устанавливают модели решения задачи и организации информационных процессов. Если известна общая модель управления некой АСУ, в которую будет внедряться базовая ИТ, мы можем представить взаимосвязь моделей базовой ИТ.

Цель базовой ИТ на логическом уровне - построение модели решаемой задачи и ее реализация на основе организации информационных процессов.

Рассмотрим взаимосвязь моделей базовой ИТ на схеме.

Рис. 3 . Логический уровень базовой ИТ. Модель организации информационных процессов.

Модель решения задачи в условиях выбранной базовой ИТ согласуется с моделью организации информационных процессов (МОИП). МОИП включает в себя МОД (модель обработки данных), МО (модель обмена данными), МУПД (модель управления данными), МНД(модель накопления данных), МПЗ (модель представления знаний). Каждая из этих моделей отражает определенные информационные процессы и содержит базы построения частных матмоделей конкретного информационного процесса.

Модель обмена - оценивает вероятностно-временные характеристики процесса обмена с учетом маршрутизации (М), коммутации (К) и передачи (П) информации. В качестве воздействий в этом процессе участвуют: входные (потоки сообщений); мешающие (потоки ошибок), и управляющие (потоки управления). На основании этой модели синтезируют систему обмена данными, то есть выбирают технологию сети, метод оптимальной коммутации, маршрутизации.

Модель накопления данных МНД. Определяет схему информационной базы СИБ, устанавливает логическую организацию информационных массивов ОИМ, задает физическое размещение информационных массивов РИМ.

Информационный массив - основное понятие, основной элемент внутримашинного информационного обеспечения. ИМ - совокупность данных по группе однородных объектов, содержащих одинаковый набор сведений. ИМ могут включать информацию:

  • программы ОС и тестовые программы (обеспечивают работу ЭВМ);
  • прикладные программы (обеспечивают решение набора функциональных задач);
  • библиотека стандартных программ.

Типы информационных массивов:

  • постоянные (формируются до начала работы системы - директивные, справочные, нормативные данные - не изменяемые во времени);
  • промежуточные (возникают как результат предыдущего расчета и основа для следующего);
  • текущие (содержат рабочую информацию о состоянии управляемого объекта);
  • служебные (обслуживают остальные массивы);
  • вспомогательные (возникают при операциях над основными массивами).

По виду носителя ИМ делятся на массивы на машинных (внутренних и внешних) и немашинных носителях.

Особенность ИМ - его структура, способ упорядочивания данных по ключевым признакам. Записи могут упорядочиваться по возрастанию или убыванию значения ключевого признака. В качестве ключевого выбирается наиболее часто встречающийся признак.

Модель обработки данных МОД. Она определяет организацию вычислительных процессов ОВП для решения задач пользователя. Последовательность и процедуры решения вычислительных задач должны быть оптимизированы с точки зрения критериев: объем памяти, ресурсы, числа обращений и т. д. Организация процесса впрямую зависит от предметной области. При разработке базовой ИТ прежде всего следует правильно выбрать ОС. Именно ОС задает реальные возможности по управлению вычислительным процессом.

Структура вычислительного процесса задается числом задач. Очень важными являются требования к моменту запуска и выпуска (выхода результатов) задач. Эти моменты определяют динамику получения результатов, то есть динамику всего процесса управления производством.

Первые ОС были ориентированы на пакетную обработку информации. Этот режим в принципе не пригоден для задач управления большой размерности и оперативности. Переход к системам разделения времени позволил в условиях прерывания отдавать предпочтение приоритетным задачам. Оказалось возможным планировать вычислительный процесс.

Новые возможности для пользователя заложены в виртуальных ОС. Она позволила пользователю иметь неограниченный вычислительный ресурс, не замечая работы соседних пользователей. В условиях распределенной обработки данных возникают новые требования к вычислительному процессу. Требуется не только распределить вычислительный ресурс между пользователями и их вычислительными задачами, но и учесть топологию пользователей.

При создании моделей организации вычислительного процесса (ОВП) используют два возможных подхода: детерминированный и вероятностный. При детерминированном подходе применяется теория расписаний очередности задач при накладываемых ограничениях. К сожалению, в этот удобный метод вмешиваются случайные помехи. Могут возникнуть непредвиденные задачи, требующие срочного решения. Для них выделяются дополнительные интервалы времени. При вероятностном подходе устанавливает средний вычислительный ресурс, среднее время выполнения программы, усредненная производительность вычислительной системы. Усредненные параметры рассчитываются на основании статистических данных и постоянно корректируются.

Если мы склонны к типизации решаемых вычислительных задач для конкретной ИТ, то очень большое значение имеет разработка пакетов прикладных программ (ППП).

Среди моделей обработки данных следует еще упомянуть имитационные модели. С их помощью решаются задачи планирования организации вычислительного процесса.

Модель представления знаний МПЗ. Модели представления знаний являются основой автоматизированного решения задач управления. Модели представления знаний существуют в виде логического Л, алгоритмического А, семантического С, фреймового Ф и интегрального И представлений.

Модель управления данными МУПД. Управление данными - управление процессами накопления, обмена и обработки данных. Накопление данных сейчас происходит в условиях современных бах данных, при этом управляющее воздействие должны обеспечить ввод информации, обновление ее, размещение массивов в БД. Эти функции осуществляет современная СУБД.

С появлением ЭВМ данные накапливались в виде совокупности одинаково построенных записей - файлов. При решении каждой новой задачи создавались новые файлы. Логическая связь между файлами отсутствовала. Возникала проблема целостности данных. Для каждого обращения к файлам создавалась своя программа. Отдельные данные в файлах дублировались. Совершенствование вычислительной техники и одновременно рост объемов информации привели к появлению концепции баз данных. В БД записи взаимосвязаны, могут совместно использоваться для решения все новых задач.

В зависимости от решаемых задач выбираются модели баз данных.

Современное производство решает огромное количество рутинных информационных задач. Но и очень велико количество задач, требующих информацию для принятия решения. Для этого требуется новые подходы к формированию данных, вводу и выводу их, обработке. Эти новые подходы реализуются с помощью новых ИТ, реализующих их взаимную организацию. Этой организацией ведает модель управления данными. Модель базируется на том, что данные обладают относительной стабильностью. Стабильность структуры данных дает возможность строить базы со стабильной структурой. А получаемую информацию отображать в виде переменных значений данных в этой стабильной структуре.

В соответствии с моделью предметной области может быть сформирован класс данных для всех решаемых задач. На логическом уровне предметная БД включает в себя логические записи, их элементы и взаимосвязь между ними.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

по способу хранения информации:

  • интегрированные;
  • распределенные;

по типу пользователя:

  • монопользовательские;
  • многопользовательские;

по характеру использования данных:

  • прикладные;
  • предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовало внедрению распределенных БД. Распределение данных по месту их использования может осуществляться различными способами:

  1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно;
  2. Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки;
  3. Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;
  4. Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные;
  5. Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему;
  6. Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

  • прикладные БД, ориентированные на конкретные приложения, например, может быть создана БД для учета и контроля поступления материалов;
  • предметные БД, ориентированные на конкретный класс данных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

  • независимость данных на концептуальном, логическом, физическом уровнях;
  • универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
  • совместимость, неизбыточность;
  • безопасность и целостность данных;
  • актуальность и управляемость.

Существуют два основных направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

  • описание данных на концептуальном и логическом уровнях;
  • загрузку данных;
  • хранение данных;
  • поиск и ответ на запрос (транзакцию);
  • внесение изменений;
  • обеспечение безопасности и целостности.

Обеспечивает пользователя следующими языковыми средствами:

  • языком описания данных (ЯОД);
  • языком манипулирования данными (ЯМД);
  • прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин баз данных (МБД). Их появление вызвано возросшими объемами информации и требованиями к скорости доступа. Слово «машина» в термине МБД означает вспомогательный периферийный процессор. Термин «компьютер БД» - автономный процессор баз данных или процессор, поддерживающий СУБД.

Основные направления МБД:

  • параллельная обработка;
  • распределенная логика;
  • ассоциативные ЗУ;
  • конвейерные ЗУ;
  • фильтры данных и др.

Совокупность процедур проектирования БД можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на основе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений могут быть классифицированы следующим образом:

  1. Приложения, использующие единственный файл.
  2. Приложения, использующие несколько файлов, в том числе:

Допускающие независимую параллельную обработку;

Допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.

Количественные критерии: время, необходимое для ответа на вопрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями.

Основные функции репозитариев:

  • парадигма включения/выключения и некоторые формальные процедуры для объектов;
  • поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
  • оповещение инструментальных и рабочих систем об интересующих их событиях;
  • управление контекстом и разные способы обзора объектов репозитария;
  • определение потоков работ.

Рассмотрим кратко основные направления научных исследований в области баз данных:

  • развитие теории реляционных баз данных;
  • моделирование данных и разработка конкретных моделей разнообразного назначения;
  • отображение моделей данных, направленных на создание методов их преобразования и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных;
  • создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
  • разработка, выбор и оценка методов доступа;
  • создание самоописываемых баз данных, позволяющих применить единые методы доступа для данных и метаданных;
  • управление конкурентным доступом;
  • развитие системы программирования баз данных и знаний, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
  • совершенствование машины баз данных;
  • разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;
  • интеграция неоднородных информационных ресурсов.

А также другие работы, которые могут Вас заинтересовать

46498. Эхинококкоз печени. Клиника, диагностика, методы хирургического лечение 17.71 KB
Эхинококкоз печени. При перкуссии расширения границ печени.Периоды развития: латентный продромальных явлений прогрессивное увеличение печени период осложнений.
46499. Анализ прибыли предприятия 17.72 KB
Прибыль предприятия характеризует превышение если наоборот то убыток выручки над расходами является главным показателем эффективности деятельности и отражает цель предпринимательства. В зависимости способа вычисления и направлений распределения различают такие основные виды прибыли предприятия: валовую балансовую прибыль операционную прибыль прибыль от обычной деятельности и прибыль после налогообложения чистую прибыль.Валовая балансовая прибыль Gross Profit разность между чистым доходом от реализации продукции и себестоимостью...
46500. Понятие и методы калькуляции затрат 17.86 KB
Калькуляция служит основой для определения средних издержек производства и установления себестоимости продукции. Методы калькуляции это методы расчёта издержек производства себестоимости продукции объёма незавершённого производства основанные на калькуляции затрат. Попередельный метод калькуляции это метод исчисления себестоимости применяемый на предприятиях где исходный материал в процессе производства проходит ряд переделов или где из одних исходных материалов в одном технологическом процессе получают различные виды продукции....
46501. Техническое диагностирование. Этапы комплексной диагностики участков МТ. 17.87 KB
Основными задачами контроля и диагностики МТ являются определение технического состояния на основе комплексного мониторинга в процессе создания и эксплуатации системы оценка и прогнозирование динамики технического состояния с целью обеспечения надежной и безопасной эксплуатации газотранспортной системы. Контроль и мониторинг технического состояния трубопроводных систем включает: получение информации в предэксплуатационный период ранняя диагностика из проектных материалов включая материалы изысканий лабораторных исследований грунтов...
46502. Диаграммы UML 17.91 KB
Диаграммы UML. UML определяет следующие диаграммы: 1. Диаграммы применения use cse Или диаграммы вариантов использования Представляют собой граф из действующих лиц ctors и их взаимодействие с системой представленное сценариями применения. Диаграммы классов Cодержат набор статических декларативных элементов как например классы типы их связи объединенные в граф.
46503. Обеспечение электробезопасности техническими способами и СЗ 17.91 KB
При случайном прикосновении для обеспечения электробезопасности применяют: защитные оболочки защитные ограждения временные или стационарные безопасное расположение токоведущих частей изоляцию этих частей и РМ малое U защитное отключение предупредительную сигнализацию блокировку и знаки безопасности; а при прикосновении к нетоковедущим металлическим частям защитное заземление зануление выравнивание потенциала защитное отключение изоляцию нетоковедущих частей электроразделение сети малое U контроль электроизоляции и СИЗ....
46504. Формы производственной деятельности фирмы 17.98 KB
Различают три основные формы организации производства: Специализация Кооперирование Комбинирование Специализация производства Специализация производства выражается в том что каждое производство ограничивается изготовлением определённого вида конструктивной и технологически однородной продукции. Соответственно этому различают четыре вида специализации предприятий: предметную; подетальную иногда называют узловая; технологическую; по услугам вспомогательного производства. Подетальная специализация характеризуется...
46505. Природа грамматического значения: общая характеристика, отношение к лексическому значению, функциональный статус 18.04 KB
Природа грамматического значения: общая характеристика отношение к лексическому значению функциональный статус. Большинство слов обладает двумя значениями: лексическим и грамматическим. В области морфологии это общие значения слов как частей речи напр. значения предметности у существительных процессуальное у глаголов а также частные значения словоформ и слов в целом противопоставляемые друг другу в рамках морфологических категорий например значения того или иного времени лица числа рода.
46506. Поверхностное упрочнение детали. Выбор метода поверхностного упрочнения 18.07 KB
При обработке поверхности шлифованием и полированием устраняющей неровности которые служат концентраторами напряжений повышается усталостная прочность детали. Назначение метода упрочняющей обработки зависит от условий работы детали в машине и ее технологических особенностей. Деталь помещают внутри спирали индуктора или под проводником по которому пропускается переменный ток большой частоты; он вызывает появление вихревых токов на поверхности детали и быстро разогревает слой с наибольшей плотностью индуцированного тока.
ВНИМАНИЕ!
Здесь приводится очень сокращённый текст реферата. Полную версию реферат по информатике можно скачать бесплатно по указанной выше ссылке.

Виды носителей информации

Носитель информации – физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг человека). Собственную память человека можно назвать оперативной памятью. Здесь слово “оперативный” является синонимом слова “быстрый”. Заученные знания воспроизводятся человеком мгновенно. Собственную память мы еще можем назвать внутренней памятью, поскольку ее носитель – мозг – находится внутри нас.

Носитель информации - строго определённая часть конкретной информационной системы, служащая для промежуточного хранения или передачи информации.

Основа современных информационных технологий – это ЭВМ. Когда речь идет об ЭВМ, то можно говорить о носителях информации, как о внешних запоминающих устройствах (внешней памяти). Эти носители информации можно классифицировать по различным признакам, например, по типу исполнения, материалу, из которого изготовлен носитель и т.п. Один из вариантов классификация носителей информации представлен на рис. 1.1.

Список носителей информации на рис. 1.1 не является исчерпывающим. Некоторые носители информации мы рассмотрим более подробно в следующих разделах.

Ленточные носители информации

Магнитная лента - носитель магнитной записи, представляющий собой тонкую гибкую ленту, состоящую из основы и магнитного рабочего слоя. Рабочие свойства магнитной ленты характеризуются её чувствительностью при записи и искажениями сигнала в процессе записи и воспроизведения. Наиболее широко применяется многослойная магнитная лента с рабочим слоем из игольчатых частиц магнитно-твёрдых порошков гамма-окиси железа (у-Fе2О3), двуокиси хрома (СrО2) и гамма-окиси железа, модифицированной кобальтом, ориентированных обычно в направлении намагничивания при записи.

Дисковые носители информации

Дисковые носители информации относятся к машинным носителям с прямым доступом. Понятие прямой доступ означает, что ПК может «обратиться» к дорожке, на которой начинается участок с искомой информацией или куда нужно записать новую информацию .

Накопители на дисках наиболее разнообразны:

  • Накопители на гибких магнитных дисках (НГМД), они же флоппи-диски, они же дискеты
  • Накопители на жестких магнитных дисках (НЖМД), они же винчестеры (в народе просто «винты»)
  • Накопители на оптических компакт-дисках:
    • CD-ROM (Compact Disk ROM)
    • DVD-ROM
Имеются и другие разновидности дисковых носителей информации, например, магнитооптические диски, но ввиду их малой распространенности мы их рассматривать не будем.

Накопители на гибких магнитных дисках

Некоторое время назад дискеты были самым популярным средством передачи информации с компьютера на компьютер, так как интернет в те времена был большой редкостью, компьютерные сети тоже, а устройства для чтения-записи компакт дисков стоили очень дорого. Дискеты и сейчас используются, но уже достаточно редко. В основном для хранения различных ключей (например, при работе с системой клиент-банк) и для передачи различной отчетной информации государственным надзорным службам.

Дискета - портативный магнитный носитель информации, используемый для многократной записи и хранения данных сравнительно небольшого объема. Этот вид носителя был особенно распространён в 1970-х - начале 2000-х годов. Вместо термина «дискета» иногда используется аббревиатура ГМД - «гибкий магнитный диск» (соответственно, устройство для работы с дискетами называется НГМД - «накопитель на гибких магнитных дисках», жаргонный вариант - флоповод, флопик, флопарь от английского floppy-disk или вообще "печенюшка"). Обычно дискета представляет собой гибкую пластиковую пластинку, покрытую ферромагнитным слоем, отсюда английское название «floppy disk» («гибкий диск»). Эта пластинка помещается в пластмассовый корпус, защищающий магнитный слой от физических повреждений. Оболочка бывает гибкой или прочной. Запись и считывание дискет осуществляется с помощью специального устройства - дисковод (флоппи-дисковод). Дискета обычно имеет функцию защиты от записи, посредством которой можно предоставить доступ к данным только в режиме чтения. Внешний вид 3,5” дискеты представлен на рис. 1.2.

Накопители на жестких магнитных дисках

В качестве накопителей на жестких магнитных дисках широкое распространение в ПК получили накопители типа «винчестер».

Термин винчестер возник из жаргонного названия первой модели жесткого диска емкостью 16 КВ (IBM, 1973 г.), имевшего 30 дорожек по 30 секторов, что случайно совпало с калибром 30/30 известного охотничьего ружья «Винчестер».

Накопители на оптических дисках

Компакт-диск («CD», «Shape CD», «CD-ROM», «КД ПЗУ») - оптический носитель информации в виде диска с отверстием в центре, информация с которого считывается с помощью лазера. Изначально компакт-диск был создан для цифрового хранения аудио (т. н. Audio-CD), однако в настоящее время широко используется как устройство хранения данных широкого назначения (т. н. CD-ROM). Аудио-компакт-диски по формату отличаются от компакт-дисков с данными, и CD-плееры обычно могут воспроизводить только их (на компьютере, конечно, можно прочитать оба вида дисков). Встречаются диски, содержащие как аудиоинформацию, так и данные - их можно и послушать на CD-плеере, и прочитать на компьютере.

Оптические диски имеют обычно поликарбонатную или стеклянную термообработанную основу. Рабочий слой оптических дисков изготавливают в виде тончайших плёнок легкоплавких металлов (теллур) или сплавов (теллур-селен, теллур-углерод, теллур-селен-свинец и др.), органических красителей. Информационная поверхность оптических дисков покрыта миллиметровым слоем прочного прозрачного пластика (поликарбоната). В процессе записи и воспроизведения на оптических дисках роль преобразователя сигналов выполняет лазерный луч, сфокусированный на рабочем слое диска в пятно диаметром около 1 мкм. При вращении диска лазерный луч следует вдоль дорожки диска, ширина которой также близка к 1 мкм. Возможность фокусировки луча в пятно малого размера позволяет формировать на диске метки площадью 1-3 мкм. В качестве источника света используются лазеры (аргоновые, гелий-кадмиевые и др.). В результате плотность записи оказывается на несколько порядков выше предела, обеспечиваемого магнитным способом записи. Информационная ёмкость оптического диска достигает 1 Гбайт (при диаметре диска 130 мм) и 2-4 Гбайт (при диаметре 300 мм).

Широкое применение в качестве носителя информации получили также магнитооптические компакт-диски типа RW (Re Writeble). На них запись информации осуществляется магнитной головкой с одновременным использованием лазерного луча. Лазерный луч нагревает точку на диске, а электромагнит изменяет магнитную ориентацию этой точки. Считывание же производится лазерным лучом меньшей мощности.

Во второй половине 1990-х годов появились новые, весьма перспективные носители документированной информации - цифровые универсальные видеодиски DVD (Digital Versatile Disk) типа DVD-ROM, DVD-RAM, DVD-R с большой ёмкостью (до 17 Гбайт).

По технологии применения оптические, магнитооптические и цифровые компакт-диски делятся на 3 основных класса:

  1. Диски с постоянной (нестираемой) информацией (CD-ROM). Это пластиковые компакт-диски диаметром 4,72 дюйма и толщиной 0,05 дюйма. Они изготавливаются с помощью стеклянного диска-оригинала, на который наносится фоторегистрирующий слой. В этом слое лазерная система записи формирует систему питов (меток в виде микроскопических впадин), которая затем переносится на тиражируемые диски-копии. Считывание информации осуществляется также лазерным лучом в оптическом дисководе персонального компьютера. CD-ROM обычно обладают ёмкостью 650 Мбайт и используются для записи цифровых звуковых программ, программного обеспечения для ЭВМ и т.п.;
  2. Диски, допускающие однократную запись и многократное воспроизведение сигналов без возможности их стирания (CD-R; CD-WORM - Write-Once, Read-Many - один раз записал, много раз считал). Используются в электронных архивах и банках данных, во внешних накопителях ЭВМ. Они представляют собой основу из прозрачного материала, на которую нанесён рабочий слой;
  3. Реверсивные оптические диски, позволяющие многократно записывать, воспроизводить и стирать сигналы (CD-RW; CD-E). Это наиболее универсальные диски, способные заменить магнитные носители практически во всех областях применения. Они аналогичны дискам для однократной записи, но содержат рабочий слой, в котором физические процессы записи являются обратимыми. Технология изготовления таких дисков сложнее, поэтому они стоят дороже дисков для однократной записи.
В настоящее время оптические (лазерные) диски являются наиболее надёжными материальными носителями документированной информации, записанной цифровым способом. Вместе с тем активно ведутся работы по созданию ещё более компактных носителей информации с использованием так называемых нанотехнологий, работающих с атомами и молекулами. Плотность упаковки элементов, собранных из атомов, в тысячи раз больше, чем в современной микроэлектронике. В результате один компакт-диск, изготовленный по нанотехнологии, может заменить тысячи лазерных дисков.

Электронные носители информации

Вообще говоря, все рассмотренные ранее носители тоже косвенно связаны с электроникой. Однако имеется вид носителей, где информации хранится не на магнитных/оптических дисках, а в микросхемах памяти. Эти микросхемы выполнены по FLASH-технологии, поэтому такие устройства иногда называют FLASH-дисками (в народе просто «флэшка»). Микросхема, как можно догадаться, диском не является. Однако операционные системы носители информации с FLASH-памятью определяют как диск (для удобства пользователя), поэтому название «диск» имеет право на существование.

Флэш-память (англ. Flash-Memory) - разновидность твердотельной полупроводниковой энергонезависимой перезаписываемой памяти. Флэш-память может быть прочитана сколько угодно раз, но писать в такую память можно лишь ограниченное число раз (обычно около 10 тысяч раз). Несмотря на то, что такое ограничение есть, 10 тысяч циклов перезаписи - это намного больше, чем способна выдержать дискета или CD-RW. Стирание происходит участками, поэтому нельзя изменить один бит или байт без перезаписи всего участка (это ограничение относится к самому популярному на сегодня типу флэш-памяти - NAND). Преимуществом флэш-памяти над обычной является её энергонезависимость - при выключении энергии содержимое памяти сохраняется. Преимуществом флэш-памяти над жёсткими дисками, CD-ROM-ами, DVD является отсутствие движущихся частей. Поэтому флэш-память более компактна, дешева (с учётом стоимости устройств чтения-записи) и обеспечивает более быстрый доступ.

Хранение информации

Хранение информации - это способ распространения информации в пространстве и времени. Способ хранения информации зависит от ее носителя (книга - библиотека, картина - музей, фотография - альбом). Этот процесс такой же древний, как и жизнь человеческой цивилизации. Уже в древности человек столкнулся с необходимостью хранения информации: зарубки на деревьях, чтобы не заблудиться во время охоты; счет предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер.

ЭВМ предназначена для компактного хранения информации с возможностью быстрого доступа к ней.

Информационная система - это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации. Наличие таких процедур - главная особенность информационных систем, отличающих их от простых скоплений информационных материалов.

От информации к данным

Человек по-разному подходит к хранению информации. Все зависит от того сколько ее и как долго ее нужно хранить. Если информации немного ее можно запомнить в уме. Нетрудно запомнить имя своего друга и его фамилию. А если нужно запомнить его номер телефона и домашний адрес мы пользуемся записной книжкой. Когда информация запомнена (сохранена) ее называют данные.

Данные в компьютере имеют различное назначение. Некоторые из них нужны только в течение короткого периода, другие должны храниться длительное время. Вообще говоря, в компьютере есть довольно много «хитрых» устройств, которые предназначены для хранения информации. Например, регистры процессора, регистровая КЭШ-память и т.п. Но большинство «простых смертных» даже не слышали таких «страшных» слов. Поэтому мы ограничимся рассмотрением оперативной памяти (ОЗУ) и постоянной памяти, к которой относятся уже рассмотренные нами носители информации.

Оперативная память компьютера

Как уже было сказано, в компьютере тоже есть несколько средств для хранения информации. Самый быстрый способ запомнить данные - это записать их в электронные микросхемы. Такая память называется оперативной памятью. Оперативная память состоит из ячеек. В каждой ячейке может храниться один байт данных.

У каждой ячейки есть свои адрес. Можно считать, что это как бы номер ячейки, поэтому такие ячейки еще называют адресными ячейками. Когда компьютер отправляет данные на хранение в оперативную память, он запоминает адреса, в которые эти данные помещены. Обращаясь к адресной ячейке, компьютер находит в ней байт данных.

Регенерация оперативной памяти

Адресная ячейка оперативной памяти хранит один байт, а поскольку байт состоит из восьми битов, то в ней есть восемь битовых ячеек. Каждая битовая ячейка микросхемы оперативной памяти хранит электрический заряд.

Заряды не могут храниться в ячейках долго - они «стекают». Всего за несколько десятых долей секунды заряд в ячейке уменьшается настолько, что данные утрачиваются.

Дисковая память

Для постоянного хранения данных используют носители информации (см. раздел «Виды носителей информации»). Компакт диски и дискеты имеют относительно небольшое быстродействие, поэтому большая часть информации, к которой необходим постоянный доступ, хранится на жестком диске. Вся информация на диске хранится в виде файлов. Для управления доступом к информации существует файловая система. Имеется несколько типов файловых систем.

Структура данных на диске

Чтобы данные можно было не только записать на жесткий диск, а потом еще и прочитать, надо точно знать, что и куда было записано. У всех данных должен быть адрес. У каждой книги в библиотеке есть свой зал, стеллаж, полка и инвентарный номер - это как бы ее адрес. По такому адресу книгу можно найти. Все данные, которые записываются на жесткий диск, тоже должны иметь адрес, иначе их не разыскать.

Файловые системы

Стоит отметить, что структура данных на диске зависит от типа файловой системы. Все файловые системы состоят из структур, необходимых для хранения и управления данными. Эти структуры обычно включают загрузочную запись операционной системы, каталоги и файлы. Файловая система также исполняет три главных функции:

  1. Отслеживание занятого и свободного места
  2. Поддержка имен каталогов и файлов
  3. Отслеживание физического местоположения каждого файла на диске.
Различные файловые системы используются различными операционными системами (ОС). Некоторые OС могут распознавать только одну файловую систему, в то время как другие OС могут распознавать несколько. Некоторые из наиболее распространенных файловых систем:
  • FAT (File Allocation Table)
  • FAT32 (File Allocation Table 32)
  • NTFS (New Technology File System)
  • HPFS (High Performance File System)
  • NetWare File System
  • Linux Ext2 и Linux Swap
FAT

Файловая система FAT используется DOS, Windows 3.x и Windows 95. Файловая система FAT также доступна в Windows 98/Me/NT/2000 и OS/2.

Файловая система FAT реализуется при помощи File Allocation Table (FAT - Таблицы Распределения Файлов) и кластеров. FAT - сердце файловой системы. Для безопасности FAT имеет дубликат, чтобы защитить ее данные от случайного стирания или неисправности. Кластер - самая маленькая единица системы FAT для хранения данных. Один кластер состоит из фиксированного числа секторов диска. В FAT записано, какие кластеры используются, какие являются свободными, и где файлы расположены в пределах кластеров.

FAT-32

FAT32 - файловая система, которая может использоваться Windows 95 OEM Service Release 2 (версия 4.00.950B), Windows 98, Windows Me и Windows 2000. Однако, DOS, Windows 3.x, Windows NT 3.51/4.0, более ранние версии Windows 95 и OS/2 не распознают FAT32 и не могут загружать или использовать файлы на диске или разделе FAT32.

FAT32 - развитие файловой системы FAT. Она основана на 32-битовой таблице распределения файлов, более быстрой, чем 16-битовые таблицы, используемые системой FAT. В результате, FAT32 поддерживает диски или разделы намного большего размера (до 2 ТБ).

NTFS

NTFS (Новая Технология Файловой Системы) доступна только Windows NT/2000. NTFS не рекомендуется использовать на дисках размером менее 400 МБ, потому что она требует много места для структур системы.

Центральная структура файловой системы NTFS - это MFT (Master File Table). NTFS сохраняет множество копий критической части таблицы для защиты от неполадок и потери данных.

HPFS

HPFS (Файловая система с высокой производительностью) - привилегированная файловая система для OS/2, которая также поддерживается старшими версиями Windows NT.

В отличие от файловых систем FAT, HPFS сортирует свои каталоги, основываясь на именах файлов. HPFS также использует более эффективную структуру для организации каталога. В результате доступ к файлу часто быстрее и место используется более эффективно, чем с файловой системой FAT.

HPFS распределяет данные файла в секторах, а не в кластерах. Чтобы сохранить дорожку, которая имеет секторы или не используется, HPFS организовывает диск или раздел в виде групп по 8 МБ. Такое группирование улучшает производительность, потому что головки чтения/записи не должны возвращаться на нулевую дорожку каждый раз, когда ОС нуждается в доступе к информации о доступном месте или местоположении необходимого файла.

NetWare File System

Операционная система Novell NetWare использует файловую систему NetWare, которая была разработана специально для использования службами NetWare.

Linux Ext2 и Linux Swap

Файловые системы Linux Ext2 и Linux были разработаны для ОС Linux OS (Версия UNIX для свободно распространения). Файловая система Linux Ext2 поддерживает диск или раздел с максимальным размером 4 ТБ.

Каталоги и путь к файлу

Рассмотрим для примера структуру дискового пространства системы FAT, как самой простой.

Информационная структура дискового пространства - это внешнее представление дискового пространства, ориентированное на пользователя и определяемое такими элементами, как том (логический диск), каталог (папка, директория) и файл. Эти элементы используются при общении пользователя с операционной системой. Общение осуществляется с помощью команд, выполняющих операции доступа к файлам и каталогам.

Источники информации

  1. Информатика: Учебник. – 3-е перераб. изд. / Под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2002. – 768 с.: ил.
  2. Волк В.К. Исследование функциональной структуры памяти персонального компьютера. Лабораторный практикум. Учебное пособие. Издательство Курганского государственного университета, 2004 г. – 72 с.

Для хранения информации человек, прежде всего, использует свою память. Можно считать, что мозг – это одно из самых совершенных хранилищ информации, во многом превосходящее компьютерные средства. Для запоминания и поиска информации используются нервные клетки мозга – нейроны, их более ста миллиардов.

К сожалению, человек многое забывает. Поэтому в древности он записывал информацию на камне, папирусе, бересте, пергаменте, а сейчас – на бумаге, магнитной ленте, электронных носителях. Это нужно еще и для того, чтобы передать знания другим людям, в том числе и следующим поколениям.

В XX веке появились новые средства хранения информации: перфокарты и перфоленты, магнитные ленты и магнитные диски, лазерные диски, флэш-память.

В любом случае информация хранится на каком-то носителе, который обладает «памятью», то есть способен сохранять свое состояние. При записи информации свойства носителя меняются: на бумагу наносятся текст и рисунки; на магнитных дисках и лентах намагничиваются отдельные участки; на лазерных дисках образуются области, по-разному отражающие свет. Во время хранения эти свойства сохраняются, что позволяет «читать» записанную информацию.

Носитель информации – это материальная среда, используемая для записи и хра­нения информации.

Хранилище информации - это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования (например, архивы документов, библиотеки, картотеки). Основной информационной единицей хранилища является определенный физический документ: анкета, книга и др. Под организацией хранилища понимается наличие определенной структуры, т.е. упорядоченность, классификация хранимых документов для удобства работы с ними.

Основные свойства хранилища информации : объем хранимой информации, надежность хранения, время доступа (т.е. время по­иска нужных сведений), наличие защиты информации.

Информацию, хранимую на устройствах компьютерной памя­ти, принято называть данными . Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами и банками данных.

Запись и чтение информации – это процессы, потому что при этом изменяются свойства носителя. При самом хранении никаких изменений не происходит, поэтому, строго говоря, процессом его назвать нельзя.

Все носители информации применяются для: записи, хранения, чтения, передачи информации. Самым распространенным носителем информации до недавнего времени была бумага. Но время идет, и качество бумажных носителей перестало устраивать современное общество, озабоченное все возрастающим и возрастающим количеством информации.

По оценкам специалистов, объем информации, фиксируемой на различных носителях, превышает один эксабайт в год (10 18 байт/год). Примерно 80% всей этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20% – на аналоговых носителях (бумага, магнитные ленты, фото- и кинопленки).

Любая компьютерная информация на любом носителе хранится в двоичном (цифровом) виде. Независимо от вида информации (текст, графика, звук, видео) – ее объем можно измерить в битах и байтах.

Понятие, о котором пойдет речь, имеет широкое распространение в повседневной нашей жизни. Информация - слово емкое, относится к общенаучным категориями и занимает важное значение в разных науках.

Само слово пришло к нам из латинского языка и в переводе оно звучит как осведомление. На самом деле это понятие абстрактное и имеет несколько значений, которые зависят конкретно от чего-либо, что определяет виды информации. Но все-таки, значение слова в том, что это, прежде всего, набор конкретных сведений, сохраненных и распространенных. А они, в свою очередь, определяют знания, которые всегда выражаются в разных формах. Они окружают человека всегда и везде, так как без этого существование самой жизни невозможно.

Различные виды информации содержатся повсюду. Все мы знаем, что от семечка яблони вырастет только яблоня и ничего более. Это на генетическом уровне заложено в дереве, и изменить ничего нельзя. Воздух - это источник информации для всех деревьев (и не только): по его состоянию деревья могут определить время, когда надо пробуждаться к жизни. А возьмите Стая летит только определенным маршрутом, который задан в их генах, и свернуть с него для них не представляется возможным.

В современном мире данное определение по представлению, способу хранения и кодирования делится на следующие виды информации:

Графическая (иногда выражается изобразительными средствами);

Звуковая;

Текстовая;

Числовая;

Видеоинформация.

Первый указанный вид сведений существует в рисунках, картинах, фотографиях, схемах, чертежах. Известен уже со времени появления первых представителей будущего общества. Звуковая информация выражается в звуках. Это тоже достаточно древнее определение. Текстовая - это способ обозначения речи символами, то есть буквами. Аналогична ей числовая: кодирование сведений при помощи цифр. Последним изобретением в современном мире стала видеоинформация - способ хранения и передачи «живых» картинок мира. Кроме всех описанных видов сведений, существует еще (ощущения, запахи, вкусы и др.)

Любые виды информации требуют способов ее хранения и передачи, особенно на дальние расстояния. Вначале для этого использовались световые сигналы, затем - радиоволны. Со времени появления компьютеров хранить и передавать любые сведения стало значительно проще. Хранить информацию можно на различных видах электронных носителях: магнитные диски, лазерные диски, специальные устройства для хранения, типа флеш-карты. Каждый день появляются новые способы и устройства. Любое понятие обрабатывается без проблем при помощи компьютера. В обработку входит воспроизведение, передача, преобразование, запись данных. Для этого надо только уметь пользоваться компьютером и специально разработанными для таких действий программами.

И, конечно, основная информация современности представлена в мировой Интернет. Способы хранения и передачи здесь несколько отличаются от привычных и знакомых человеку. Так как ее объемы в Интернете очень большие, то и способы работы с ней особые. Программное обеспечение усовершенствуется каждый день, что дает возможность работать с такой информацией коллективно и постоянно.

Свойства

Информация, как мы уже говорили, это конкретный объект, и как все они, она обладает определенными свойствами, перечислять которые можно долго. Остановимся только на самых важных критериях. Итак, ценная и полезная информация в первую очередь должна быть:

Достоверной;

Объективной;

Актуальной;

Хранение и накопление информации вызвано ее многократным использованием, применением постоянной информации, необходимостью комплектации первичных данных до их обработки; осуществляется на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования группировочному признаку.

Хранение информации - это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

В результате реализации такого алгоритма документ, независимо от формы представления поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях: внешнем, концептуальном (логическом), внутреннем, физическом.

Рис. 1.16.

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском - операцией, предполагающей извлечение хранимой информации.

Хранение информации в ЭВМ связано с процессом ее арифметической обработки и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Информационный массив система хранения информации, включающая представление данных и связей между ними, т. е. принципы их организации.

С учетом этого рассматриваются следующие структуры организации информационных массивов: линейная, многомерная.

В свою очередь, линейная структура данных делится на строки, одномерные массивы, стеки, очереди, деки и др.

Строка это представление данных в виде элементов, располагающихся по признаку непосредственного следования, т. е. по мере поступления данных в ЭВМ.

Одномерный массив - это представление данных, отдельные элементы которых имеют индексы, т. е. поставленные им в соответствие целые числа, рассматриваемые как номер элемента массива.

Индекс обеспечивает поиск и идентификацию элементов, а следовательно, и доступ к заданному элементу, что облегчает его поиск по сравнению с поиском в строке.

Идентификация процесс отождествления объекта с одним из известных объектов.

Стек структура данных, учитывающая динамику процесса ввода-вывода информации, использующая линейный принцип организации хранения, реализующий процедуру обслуживания "последним пришел - первым ушел" (первым удаляется последний поступивший элемент).

Очередь структура организации данных, при которой для обработки информации выбирается элемент, поступивший ранее всех других.

Дека структура организации данных, одновременно сочетающая рассмотренные виды.

Нелинейные структуры хранения данных используют многомерные структуры (массивы) следующих видов: деревья, графы, сети.

Элемент многомерного массива определяется индексом, состоящим из набора чисел. Формой представления прямоугольного массива является матрица, каждое значение которой определяется индексом требуемого элемента массива. Так, в двухмерном массиве элементы обозначаются двумя индексами, а в трехмерном тремя.

Списковая структура с механизмом адресных ссылок может быть представлена в виде графа древовидной структуры. В нем каждый элемент списка включает в себя маркерное поле, поле данных и адресное поле. Маркерное поле предупреждает, имеется ли ссылка на другой список или она отсутствует. В зависимости от этого в маркерном поле ставится знак минус или плюс.

Списки так же могут быть показаны ориентированными графами с полями, в которых возможна ссылка вперед и назад. Возникает так называемый симметричный список, и появляется возможность движения в структуре данных в разных направлениях.

Рассмотренные списковые структуры информационных массивов имеют следующие особенности:

  • - высокую логическую простоту;
  • - относительно большое количество времени доступа, обусловленное адресным обращением к данным, при котором к каждому элементу списка необходимо иметь ссылку;
  • - значительное возрастание объема памяти запоминающего устройства по сравнению с последовательной структурой организации информационных массивов, обусловленное адресным обращением к данным.

С учетом рассмотренных структур формирования информационных массивов можно представить ряд способов организации массивов (рис. 1.17) в запоминающих устройствах ЭВТ.

Рис. 1.17. Способы организации массивов информации в запоминающем устройстве ЭВТ

На физическом уровне любые записи информационного поля представляют в виде двоичных символов. Обращение к памяти большого объема требует большой длины адреса. Если память имеет емкость 2n слов, то для поиска таких слов потребуются n-разрядные адреса. В микропроцессорах восьмиразрядные слова дают возможность обращаться к 256 ячейкам памяти, что оказывается недостаточно для хранения информации в автоматизированных системах. Если непосредственно обращение к любой ячейке невозможно, переходят к страничной организации памяти.

В этом случае выбирают область памяти емкостью 2n слов и называют страницей, обращение к которой осуществляется командой, содержащей n-разрядное адресное поле. В микропроцессорах обычно используют страницы размером 256 слов.

Принципы адресации, объемы памяти, количественные характеристики зависят от функционального назначения запоминающих устройств, разделяющимся по уровням функциональной иерархии на сверхоперативные, оперативные, постоянные, полупостоянные, внешние, буферные.

С хранением информации связаны следующие понятия: носитель информации (память), внутренняя память, внешняя память, хранилище информации.

Носитель информации - это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг), которую можно назвать оперативной (быстрой) памятью или внутренней памятью, поскольку ее носитель находится внутри нас.

Другие носители информации можно назвать внешними (по отношению к человеку), например бумага, которая, непригодна в обычных (не специальных) условиях для длительного хранения информации: на нее оказывают вредное воздействие температурные условия.

Для ЭВТ по материалу изготовления различают бумажные, металлические, пластмассовые, комбинированные и другие носители; по принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.; по методу считывания различают контактные, магнитные, электрические, оптические. Хранение информации осуществляется на специальных носителях. информационный поток переработка

Хранилище информации - это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования, например архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ: анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т. е. упорядоченность, классификация хранимых документов. Она необходима для удобства ведения хранилища: пополнения новыми документами, удаления ненужных, поиска информации и т. д.

Основные свойства хранилища информации: объем хранимой информации, надежность хранения, время доступа (т. е. время поиска нужных сведений), наличие защиты информации.

Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Для описания хранения данных используют те же понятия: носитель, хранилище данных, организация данных, время доступа, защита данных. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных и банками данных.

Таким образом, хранение информации представляет собой процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

Заключение

Информатика как система получения, передачи и использования информационного ресурса в общественной практике подводит теоретический фундамент под использование ЭВМ и автоматизированных систем, которые и предназначены для усиления информационных процессов в обществе, использования информационного ресурса. Речь идет прежде всего о специальных ИР, основанных на компьютерной технике и реализующих информационный ресурс, т.е. инженерную обработку знаний). Таким образом, предметом информатики является информационный ресурс как симбиоз знания и информации. Он выступает в качестве предмета новой науки и с содержательной, и с формально-математической, и с технической стороны. Необходимо разграничивать предмет информатики как фундаментальной науки, ее объект и инструментарий: основанные на ЭВМ вычислительные системы, программы, сети связи и т. д. Без ЭВМ нет информатики, но нельзя объявлять информатику наукой об ЭВМ. Конечно, практическая необходимость в информатике возникла в связи с использованием ЭВМ. Но, «оттолкнувшись от ЭВМ», информатика во главу угла ставит новые понятия -- информационный ресурс и его социальную полезность, отдачу. Поэтому по аналогии с термодинамикой информатику можно назвать информдинамикой -- наукой о развитии социальных систем под воздействием информационного ресурса (семантической информации).

В последнее время компьютеры «проникли» в жилища людей и постепенно становятся предметами первой необходимости. Есть два основных направления использования компьютеров дома.

Обеспечение нормальной жизнедеятельности жилища:

охранная автоматика, противопожарная автоматика, газоанализаторная автоматика;

управление освещенностью, расходом электроэнергии, отопительной системой, управление микроклиматом;

электроплиты, холодильники, стиральные машины со встроенными микропроцессорами.

Обеспечение информационных потребностей людей, находящихся в жилище:

заказы на товары и услуги;

процессы обучения;

общение с базами данных и знаний;

сбор данных о состоянии здоровья;

обеспечение досуга и развлечений;

обеспечение справочной информацией;

электронная почта, телеконференции;