SQL "для чайников": что нужно знать начинающим? MySQL – почему и для чего

Которая ранее приобрела шведскую компанию MySQL AB . Продукт распространяется как под GNU General Public License , так и под собственной коммерческой лицензией. Помимо этого разработчики создают функциональность по заказу лицензионных пользователей, именно благодаря такому заказу почти в самых ранних версиях появился механизм репликации .

MySQL является решением для малых и средних приложений. Входит в состав серверов WAMP , AppServ , LAMP и в портативные сборки серверов Денвер , XAMPP . Обычно MySQL используется в качестве сервера, к которому обращаются локальные или удалённые клиенты, однако в дистрибутив входит библиотека внутреннего сервера, позволяющая включать MySQL в автономные программы.

Гибкость СУБД MySQL обеспечивается поддержкой большого количества типов таблиц: пользователи могут выбрать как таблицы типа MyISAM , поддерживающие полнотекстовый поиск, так и таблицы InnoDB , поддерживающие транзакции на уровне отдельных записей. Более того, СУБД MySQL поставляется со специальным типом таблиц EXAMPLE, демонстрирующим принципы создания новых типов таблиц. Благодаря открытой архитектуре и GPL-лицензированию, в СУБД MySQL постоянно появляются новые типы таблиц.

Сообществом разработчиков MySQL созданы различные ответвления кода, такие как Drizzle (англ. ), OurDelta, Percona Server, и MariaDB . Все эти ответвления уже существовали на момент поглощения компании Sun корпорацией Oracle.

О происхождении MySQL

MySQL возникла как попытка применить mSQL к собственным разработкам компании: таблицам, для которых использовались ISAM - подпрограммы низкого уровня. В результате был выработан новый SQL -интерфейс, но API -интерфейс остался в наследство от mSQL. Откуда происходит название «MySQL» - доподлинно неизвестно. Разработчики дают два варианта: либо потому, что практически все наработки компании начинались с префикса My , либо в честь девочки по имени My , дочери Майкла Монти Видениуса , одного из разработчиков системы .

Логотип MySQL в виде дельфина носит имя «Sakila». Он был выбран из большого списка предложенных пользователями «имён дельфина». Имя «Sakila» было отправлено -разработчиком Ambrose Twebaze.

Лицензирование

MySQL имеет двойное лицензирование. MySQL может распространяться в соответствии с условиями лицензии GPL . Однако по условиям GPL, если какая-либо программа включает исходные коды MySQL, то она тоже должна распространяться по лицензии GPL. Это может расходиться с планами разработчиков, не желающих открывать исходные тексты своих программ. Для таких случаев предусмотрена коммерческая лицензия, которая также обеспечивает качественную сервисную поддержку.

Платформы

MySQL портирована на большое количество платформ: AIX , BSDi , FreeBSD , HP-UX , Linux , Mac OS X , NetBSD , OpenBSD , OS/2 Warp, SGI IRIX , Solaris , SunOS , SCO OpenServer, SCO UnixWare, Tru64 , Windows 95 , Windows 98 , Windows NT , Windows 2000 , Windows XP , Windows Server 2003 , WinCE, Windows Vista и Windows 7 . Существует также порт MySQL к OpenVMS . Важно отметить, что на официальном сайте СУБД для свободной загрузки предоставляются не только исходные коды, но и откомпилированные и оптимизированные под конкретные операционные системы готовые исполняемые модули СУБД MySQL.

Языки программирования

История выпусков

MySQL 4.0

Несмотря на то, что версия 4.0 является устаревшей, она всё ещё имеет значительное распространение. Основные возможности этой версии:

  • практически полная реализация ANSI SQL-99, плюс расширения;
  • межплатформенная совместимость;
  • независимые типы таблиц (MyISAM для быстрого чтения, InnoDB для транзакций и ссылочной целостности);
  • поддержка SSL ;
  • кэширование запросов;
  • репликация : один головной сервер на одного подчинённого, много подчинённых на одного головного;
  • полнотекстовая индексация и поиск с использованием типа таблиц MyISAM;
  • внедрённая библиотека базы данных;
  • поддержка Юникода (UTF-8);
  • таблицы InnoDB , обеспечивающие соответствие требованиям ACID ;
  • встроенный сервер, позволяющий включать MySQL в автономные приложения.

MySQL 4.1

  • вложенные запросы и производные таблицы.
  • новая система кодировок и сортировок;
  • более быстрый и гибкий протокол клиент-сервер с поддержкой подготовленных запросов, обеспечивающий их оптимальное исполнение;
  • новая программа установки и настройки для Microsoft Windows и Linux ;
  • защищённые через OpenSSL соединения клиент-сервер;
  • высоко-оптимизированная библиотека, которая может быть использована в сторонних программах;
  • полноценная поддержка Юникода (UTF-8 и UCS2);
  • стандартные пространственные типы данных GIS , для хранения географической информации;
  • улучшенный полнотекстовый поиск и система помощи.

MySQL 5.0

Версия MySQL 5.0 вышла 24 октября 2005 года, в этой версии значительно расширена функциональность, которая ставит MySQL в один ряд с коммерческими СУБД . Если раньше СУБД MySQL обвиняли в недостаточной поддержке стандарта SQL , то с появлением пятой версии этой популярной базы данных, появилась практически полная поддержка стандарта SQL. MySQL 5.0 содержит следующие нововведения:

  • хранимые процедуры и функции;
  • обработчики ошибок;
  • информационная схема (так называемый системный словарь, содержащий метаданные).

MySQL 5.1

Версия MySQL 5.1 продолжает путь к стандарту SQL:2003 . MySQL 5.1 содержит следующие нововведения.

  • Сегментирование - возможность разбить одну большую таблицу на несколько частей, размещенных в разных файловых системах, основываясь на определенной пользователем функции. При определенных условиях это может дать серьёзное увеличение производительности и, кроме того, облегчает масштабирование таблиц.
  • Изменено поведение ряда операторов, для обеспечения большей совместимости со стандартом SQL2003.
  • Построчная репликация (англ. row-based replication ), при которой в бинарный лог будет записываться только информация о реально измененных строках таблицы вместо оригинального (и, возможно, медленного) текста запроса. Построчную репликацию можно использовать только для определенных типов sql-запросов, в терминах MySQL - смешанная репликация (англ. mixed replication ).
  • Встроенный планировщик периодически запускаемых работ. По синтаксису добавление задачи похоже на добавление триггера к таблице, по идеологии - на crontab .
  • Дополнительный набор функций для обработки XML , реализация поддержки XPath .
  • Новые средства диагностики проблем и утилиты для анализа производительности. Расширены возможности по управлению содержимым лог-файлов, логи теперь могут быть сохранены и в таблицах general_log и slow_log. Утилита mysqlslap позволяет провести нагрузочное тестирование БД с записью времени реакции на каждый запрос.
  • Для упрощения операции обновления подготовлена утилита mysql_upgrade, которая выполнит проверку всех существующих таблиц на предмет совместимости с новой версией, и при необходимости выполнит надлежащие корректировки.
  • MySQL Cluster отныне выпущен как отдельный продукт, базирующийся на MySQL 5.1 и хранилище NDBCLUSTER.
  • Значительные изменения в работе MySQL Cluster, такие, как, например, возможность хранения табличных данных на диске.
  • Возврат к использованию встроенной библиотеки libmysqld, отсутствовавшей в MySQL 5.0.
  • API для плагинов, которое позволяет загружать сторонние модули, расширяющие функциональность (например, полнотекстовый поиск), без перезапуска сервера.
  • Реализация парсера полнотекстового поиска в виде plug-in.
  • Новый тип таблиц Maria (устойчивый к сбоям клон MyISAM).

Тип таблиц Maria

Maria (начиная с версии 5.2.x - Aria) - расширенная версия хранилища MyISAM , с добавлением средств сохранения целостности данных после краха.

  • В случае краха производится откат результатов выполнения текущей операции или возврат в состояние до команды LOCK TABLES. Реализация через ведение лога операций.
  • Возможность восстановления состояния из любой точки в журнале операций, включая поддержку CREATE/DROP/RENAME/TRUNCATE. Может быть использовано для создания инкрементальных резервных копий, через периодическое копирование журнала операций.
  • Поддержка всех форматов столбцов MyISAM, расширена новым форматом «rows-in-block», использующим страничный способ хранения данных, при котором данные в столбцах могут кэшироваться.
  • В будущем будет реализовано два режима: транзакционный и без отражения в журнале транзакций, для некритичных данных.
  • Размер страницы данных равен 8Кб (в MyISAM 1Кб), что позволяет достичь более высокой производительности для индексов по полям фиксированного размера, но медленнее в случае индексирования ключей переменной длины.

MySQL 5.5

Ветка MySQL 5.5 базируется на невыпущенной серии MySQL 5.4 и содержит ряд значительных улучшений, связанных с повышением масштабируемости и производительности, среди которых:

  • Использование по умолчанию движка InnoDB.
  • Поддержка полусинхронного (semi-synchronous) механизма репликации, основанного на патчах к InnoDB от компании Google.
  • Улучшение функций по секционированию данных. Расширенный синтаксис для разбиения больших таблиц на несколько частей, размещенных в файловых системах (partitioning). Добавлены операции RANGE, LIST и метод оптимизации «partition pruning».
  • Новый механизм оптимизации вложенных запросов и JOIN-операций.
  • Переработана система внутренних блокировок.
  • Интегрированы патчи Google с оптимизацией работы InnoDB на процессорах с большим количеством ядер.

MySQL 6.0

Версия MySQL 6.0 была заморожена на стадии альфа-тестирования. Первоначально было принято решение о создании версии 5.2, вскоре эта версия была переименована в 6.0. Однако, позже информация о MySQL 6.0 исчезла с сайта, а разработчики сосредоточились на версии 5.5 и следующей за ней версии 5.6.

Одним из основных нововведений версии 6.0 планировался новый тип таблиц Falcon, разработанный в качестве потенциальной замены для InnoDB компании Innobase , приобретённой компанией Oracle . В связи с приобретением в 2010 году Sun Microsystems тем же Oracle , судьба Falcon остаётся под вопросом.

Технические характеристики

Максимальные размеры таблиц

Максимальный размер таблиц в MySQL 3.22 до 4 ГБ, в последующих версиях максимальный размер до 8 млн ТБ (2 63 байт).

Размер таблицы ограничен её типом. В общем случае тип MyISAM ограничен предельным размером файла в файловой системе операционной системы . Например в NTFS этот размер теоретически может быть до 32 эксабайт . В случае InnoDB одна таблица может храниться в нескольких файлах, представляющих единое табличное пространство . Размер последнего может достигать 64 терабайт .

В отличие от MyISAM в InnoDB имеется значительное ограничение на количество столбцов, которое можно добавить в одну таблицу. Размер страницы памяти по умолчанию составляет 16 килобайт, из которых под данные отведено 8123 байта. Размер указателя на динамические поля составляет 20 байт. Таким образом, в случае использования динамического формата строки (ROW_FORMAT=DYNAMIC), одна таблица может вместить максимум 409 столбцов типа blob или text.

Локализация

Начиная с версии 4.1 в СУБД MySQL внедрена новая система кодировок и сортировок. При использовании кодировки Windows-1251, перед выполнением SQL-инструкций необходимо настроить кодировку соединения при помощи операторов:

SET character_set_client= "cp1251" ; SET character_set_results= "cp1251" ; SET character_set_connection= "cp1251" ;

Эти три оператора эквивалентны вызову одного оператора:

SET NAMES "cp1251"

Переменная character_set_client устанавливает кодировку данных отправляемых от клиента, переменная character_set_results устанавливает кодировку данных отправляемых клиенту, переменная character_set_connection устанавливает кодировку, в которую преобразуется информация пришедшая от клиента, перед выполнением запроса на сервере.

При использовании Юникода UTF-8 этот оператор выглядит следующим образом:

SET NAMES "utf8"

Кодировка ISO 8859-5 не поддерживается.

Примечания

См. также

Ссылки

  • mysql.com - официальный сайт MySQL (англ.)
  • Документация на сайте разработчиков MySQL (англ.)

Литература

  • В. Васвани. MySQL: использование и администрирование = MySQL Database Usage & Administration. - М .: «Питер» , 2011. - 368 с. - ISBN 978-5-459-00264-5
  • Стив Суэринг, Тим Конверс, Джойс Парк. PHP и MySQL. Библия программиста, 2-е издание = PHP 6 and MySQL 6 Bible. - М .: «Диалектика», 2010. - 912 с. - ISBN 978-5-8459-1640-2
  • Роберт Шелдон, Джоффрей Мойе. MySQL 5: базовый курс = Beginning MySQL. - М .: «Диалектика», 2007. - 880 с. - ISBN 978-5-8459-1167-4
  • MySQL на примерах. - Спб.: «БХВ-Петербург», 2008. - С. 952. - ISBN 978-5-9775-0066-1
  • Поль Дюбуа. MySQL, 3-е издание = MySQL, 3ed. - М .: «Вильямс», 2006. - 1168 с. - ISBN 5-8459-1119-2
  • Кузнецов Максим, Симдянов Игорь. MySQL 5. В подлиннике. - Спб.: «БХВ-Петербург», 2006. - С. 1024. - ISBN 5-94157-928-4
  • Кузнецов Максим, Симдянов Игорь. Самоучитель MySQL 5. - Спб.: «БХВ-Петербург», 2006. - С. 560. - ISBN 5-94157-754-0

MySQL — многопоточный компактный сервер баз данных. Он отличается высокой скоростью, доступностью, легкостью и устойчивостью в использовании.

Разработка MySQL

Компания tcx разработала сервер MySQL для внутренних потребностей. Главной задачей была быстрая обработка баз данных большого объема. Компания утверждает, что MySQL применяется с 1996 года на сервере, имеющим более 40 БД. В общей сложности эти базы содержат около 10 000 таблиц, более 500 из которых имеют 7 миллионов строк.

MySQL — идеальная разработка для средних и малых приложений. Многие платформы используют исходники этого сервера. Значительный прирост производства обеспечивается использованием полных возможностей MySQL на Unix-серверах.

Стоимость MySQL

MySQL является бесплатным сервером для некоммерческого использования. В противном случае необходима покупка лицензии. Она обойдется минимум в 190 евро.

Возможности сервера MySQL

MySQL при стандарте ANSI 92 поддерживает язык запросов SQL. К этому стандарту разработано множество расширений, которых нет ни в других системах управления базами данных.

Основной перечень возможностей сервера можно впечатляет:

Недостатки сервера MySQL

Скорость сервера повлияла на некоторые параметры. Разработчики пожертвовали некоторыми требованиями в СУБД.

В MySQL отсутствуют:

  • Поддержка вложенных запросов. Однако разработчики обещают включить эту возможность в следующую версию сервера.
  • Поддержка представления.
  • Поддержка различных транзакций.
  • Поддержка внешних ключей.
  • Поддержка хранимых процессов и триггеров.

Создатели сервера утверждают, что именно последние три пункта повлияли на скорость. Если эти возможности будут реализованы, сервер перестанет славится своим быстродействием. Перечисленные возможности не являются определяющими при создании приложений. В общем итоге, скорость и невысокая стоимость сформировали высокую популярность MySQL.

Механизмы обеспечения безопасности сервера MySQL

Прежде чем приводить примеры, следует уделить немного внимания одному из самых важных показателей данного сервера — таблице привилегий MySQL, механизме целостности и безопасности данных.

Подобные таблицы применяются для аутентификации пользователей в случае обращения к системе и дальнейшему связыванию правового доступа обращения с набором заложенных привилегий. Набор привилегий — это перечень действий, которые может производить конкретный пользователь в системе, базе данных и даже с конкретными таблицами.

Например, администратор может предоставить пользователю привилегии, достаточные для подключения к отдельной базе данных. Это создает ограничение в доступе к другим серверам для пользователя. Более того, администратор может разрешить лишь некоторые действия. Например, работу с базой данных, модификацию, выбор и вставку данных. Любая другая операция будет недоступна данному пользователю и попытка осуществить ее будет безуспешной из-за отсутствия у него соответствующих прав. Так же смотрите выбор хостингов Украины нашего рейтинга

Те, кто создают свои сайты вручную, без помощи конструкторов, или формируют приложения, которое будет взаимодействовать с онлайн-сервисом, сталкиваются с проблемой хранения данных. Где-то необходимо будет сохранять все аккаунты пользователей, их данные. С помощью чего это всё осуществляется? MySQL - что это, и почему оно имеет самое непосредственное отношение к статье? Дело в том, что это механизм доступа к хранимым данным на различных сайтах или в программах, что имеют доступ к сети. Поэтому и надо узнать, MySQL - что это, каковы особенности его применения при программировании.

Структурированный язык запросов

Но первоначально следует узнать, как вообще делаются запросы про что-то. Существует довольно значительное количество способов организовать запросы к определённым данным, что имеются у информационной системы. Одна из таких возможностей - это (английская аббревиатура SQL). Он позволяет создавать краткие запросы по отбору необходимой информации. Но работать он может исключительно с двухмерными таблицами, к которым выдвигается ещё ряд требований. При использовании структурированным языком запросов обязательно необходимо указывать требуемую информацию и откуда она должна быть взята. Можно ещё задать и ряд дополнительный требований, отсортировать, основываясь на каком-то условии, или просто сгруппировать. Для получения незначительных объемов необходимых данных подходит весьма хорошо.

Зачем нужен MySQL?

И причем здесь MySQL? Что это вообще такое? Как могли понять наиболее догадливые читатели, это особенное расширение структурированного Но где он используется? Дело в том, что это специальная версия для использования в сегменте веб-программирования. Обычный язык структурированных запросов больше рассчитан на работу на компьютере, тогда как MySQL - на веб-сегмент.

В чём отличие MySQL и SQL

Вот в разнице сегментов применения и заключается основное отличие. Но существуют и определённые процедурные отличия. Так, прежде чем работать с базой данных с помощью запросов MySQL, необходимо получить доступ. Да и работа MySQL самого по себе является, мягко говоря, невозможным. Поэтому часто используется ещё один дополнительный язык программирования (чаще всего PHP, хотя можно встретить и конструкторы создания соединений, которые именуют MySQL server).

Что такое запросы?

Сейчас, когда дан ответ на вопрос «MySQL - что это», прежде чем перейти к возможным ошибкам, которые могут возникнуть во время написания программ, следует рассмотреть еще ряд моментов: что такое запросы, базы данных, таблицы и записи. И начнем с запросов: они представляют собой краткое по содержанию кодированное сообщение на предоставление данных, причем обязательно должна содержаться информация о том, где их искать, и ключевые слова, по которым поиск будет осуществляться. С тем, где искать, проблем быть не должно. А вот что такое ключевые слова? Или как часто можно встретить ключ? Для различия необходимых данных применяют принцип уникальной информации. В их качестве может выступать индивидуальный номер или другие данные. Но как более совершенные используются всё же номерные распознаватели.

Что такое базы данных?

А где хранятся данные, к которым посредством MySQL получают доступ? Само собой, в базах данных! В MySQL они представляют собой двухмерные таблицы, в которых содержится необходимая информация. Причем идентифицируются по значению данных, которые могут быть в БД благодаря столбцам. А информация о каждом новом субъекте добавляется в создаваемую новую строчку. В базах данных может содержаться значительное количество таблиц (условно неограниченное), но величина базы данных влияет на скорость ответа и предоставления данных. Но прежде чем работать с БД, необходимо удостовериться, что существует поддержка необходимого программного обеспечения и MySQL Server сможет запуститься. Хотя всё тут зависит от начальных условий - если вы работаете на платном хостинге, всё уже почти всегда установлено. Но если был взят в аренду сервер, над которым следует работать с нуля, то база MySQL может и не работать должным образом в силу того, что нет программного обеспечения, которое позволит интерпретировать данные.

Что такое таблицы?

Таблицы, как уже говорилось, это инструментарий, в котором хранятся необходимые данные. Какая у них особенность? При создании таблицы обязательно следует указывать, которой базе данных она будет принадлежать. Ситуации, когда таблицы существуют сами по себе, довольно проблематичны - ввиду того, что большинство программных инструментов рассчитаны на то, что они будут взаимодействовать с определёнными программами.

Как выглядят обычно MySQL таблицы? Они имеют столбцы информации (определённого и ряды, в которых хранится информация по каждому субъекту. С рядами всё просто - появился новый субъект - добавляется новый ряд (при удалении он удаляется). Со столбцами немного сложнее. Дело в том, что один столбец может иметь данные только одного типа. Так, если будет производиться работа с числовым столбцом, то записать в него текст нельзя. А видов различных типов существует довольно много (около 30, что уже тянет на отдельную статью).

Что такое записи?

И самое последнее перед тем как перейти к ошибкам, которые могут возникнуть в процессе использования MySQL, - записи. Каждая запись (или рядок) должна иметь уникальный идентификатор, который позволит искать его в таблице или нескольких таблицах. Потенциально ограничения на его длину нет, но для удобства просмотра в «ручном» режиме прибегают к приведению в «нормальные» формы. Суть такого приведения заключается в том, что запись разбивается на несколько частей и размещается в разных таблицах. Несмотря на такое деление, ее можно собрать воедино благодаря уникальному идентификатору. Смысл приведения в нормальные формы заключается в том, чтобы сгруппировать информацию по объектам на основании чего-то общего. Так, в библиотеке могут быть созданы таблицы «Человек», «Книги» и «Журналы». Хотя на практике можно было бы реализовать и одну таблицу с одной записью, в которой будет находиться вся необходимая информация.

Возможные ошибки при использовании

Теперь можно подойти и к теме №2. Из-за чего возникают ошибки? В большинстве случаев во всё виноват человеческий фактор. Это может быть элементарная ошибка, которая закралась в код во время его набора, или неправильно составленный запрос:

  1. Если есть ошибка подключения к базе данных, необходимо проверить её целостность, а также файл запроса: в нём может быть указано неправильное имя БД или пароль к ней. Возможно, сообщение MySQL error возникает из-за отсутствия настройки программного средства, которое должно подключаться к базе данных и обеспечивать считывание информации.
  2. При запросе данных из таблиц необходимо позаботиться о качественной дешифровке информации, а также об обратной передаче информации от MySQL сервера к вам. Как уже выше упоминалось, как правило, MySQL используется при поддержке «посредников», поэтому не лишним будет проверить с помощью средств отладки на то, приходят ли необходимые данные вообще. Если они приходят, но вы не можете их использовать - значить дело в декодировании полученных данных. В таком случае желательно перепробовать все рабочие варианты, начиная с самых наименьших рабочих объемов. Следует помнить, особенно тем, кто только начинает постигать программирование, что это такая область, где всё решается практикой, и MySQL error можно самому убрать, перепробовав все возможные варианты.

MySQL представляет собой очень популярную систему управления базами данных (СУБД), разрабатываемую фирмой MySQL АВ. MySQL АВ является коммерческой компанией, строящей свой бизнес на сервисах, сосредоточенных на базе данных MySQL и базирующейся в Швеции. Дальнейшую поддержку MySQL осуществляет корпорация Oracle, получившая права на торговую марку вместе с поглощённой Sun Microsystems, которая ранее приобрела шведскую компанию MySQL AB.

Официально MySQL произносится как «Май-Эс-Ку-Эль», а не как MY-SEQUEL. Это столь распространенная ошибка, что разработчики MySQL даже поместили соответствующее объявление на своем сайте.

Название возникло из сокращения (а вернее, слияния) слов My SQL, что на английском языке значит «мой SQL». Названию около десяти лет, оно прижилось еще в те времена, когда пакет не был коммерческой разработкой.

  • самой лучшей и наиболее используемой базой данных в мире;
  • доступным для всех;
  • легким в использовании, насколько это возможно для такого пакета;
  • непрерывно совершенствующимся, быстрым и безопасным;
  • не содержащим ошибок.

Пока им это удается. Рассмотрим все это более подробно и введем некоторые базовые термины.

MySQL представляет собой систему управления базами данных (СУБД)

Базой данных называют структурированный набор данных. Это может быть что угодно: от простого перечня покупок до галереи изображений. Чтобы добавлять, обращаться и обрабатывать данные, сохраненные в компьютерной базе данных, вы нуждаетесь в системе управления базой данных, например MySQL.

Так как компьютеры очень хороши при обработке больших количеств данных, базы данных играют центральную роль в вычислениях. Человек способен понять данные, представленные в какой угодно форме, лишь бы их было не очень много. Компьютер же наоборот: количество данных для него почти не имеет значения, но вот их структура должна строго соответствовать критериям программы.

MySQL является реляционной СУБД

Реляционная база данных сохраняет данные в отдельных таблицах (реляциях). Это улучшает быстродействие и гибкость. Таблицы связаны определенными отношениями, делающими возможным объединять данные из нескольких таблиц в одном запросе для поиска информации. Таким образом, краеугольным понятием для вашей последующей работы должна стать таблица . Именно в таблицах MySQL хранит все, даже свои внутренние структуры и данные.

MySQL использует язык запросов SQL

Поскольку данных много, нужен какой-то способ быстро получать именно те, которые сейчас понадобились. Для этого надо иметь возможность указать серверу найти данные, отвечающие неким критериям. С этой целью был разработан язык SQL (Structured Query Language, язык структурированных запросов), наиболее общий стандартизированный язык, используемый, чтобы обращаться к компьютерным базам данных. Именно с этим языком работают почти все современные СУБД. Вот тут возникает одна проблема. Дело в том, что если уж создается некий универсальный язык для работы с базами данных, то он должен быть четко стандартизован.

Не так все просто. В процессе разработки языка SQL несколько фирм, которые тогда определяли ситуацию на рынке СУБД, так и не смогли толком договориться об окончательных стандартах. Дело затягивалось, и фирмы начали применять в своих системах разные версии SQL: каждая фирма вносила свои улучшения, что погубило саму идею единого языка.

В конце концов, после бурных дебатов, в 1992 году стандарт на SQL был наконец принят и получил название ANSI SQL92 (также его назвали классическим SQL). Но было уже поздно. В разных СУБД SQL уже использовался везде, но свой у каждого разработчика.

Были попытки привести их к общему знаменателю, но ничего не вышло: стандарт определил лишь общие понятия и правила, очень многое оставив на совести разработчиков конкретной реализации. Так появились диалекты SQL. В частности, MySQL использует весьма специфический диалект SQL, далеко не во всем соответствующий стандарту. Именно он и рассмотрен в здесь, в самоучителе. В нём отмечены наиболее принципиальные отличия MySQL от ANSI SQL.

Вообще-то MySQL старается соответствовать ANSI SQL, где это возможно. Более того, сервер MySQL может быть запущен в режиме полного соответствия ANSI SQL, но тогда отменятся многие дополнительные возможности MySQL.

SQL представляет собой язык управления базами данных. Часто его называют языком программирования, но это не так. Хоть он и является языком для общения с компьютерными программами, но к программированию управление базами данных не имеет никакого отношения. Это совсем другая область компьютерной технологии.

Почему используют MySQL?

MySQL является системой «клиент-сервер»

Это значит, что MySQL состоит из одного SQL-сервера, который поддерживает различные функции (собственно, он и выполняет всю работу с базами данных), нескольких различных программ-клиентов (они обеспечивают только интерфейс между пользователем и сервером), административных инструментальных средств и нескольких интерфейсов программирования. Клиенты взаимодействуют с сервером, используя собственный сетевой протокол.

Такая схема позволяет большому числу пользователей одновременно работать с сервером. В том числе, совместно обрабатывать одни и те же данные, не мешая друг другу. Такое взаимодействие будет подробно рассмотрено в последующих главах.

Обычно клиент и сервер используются на разных компьютерах, но допустим вариант установки обоих частей пакета на одном компьютере. Даже в рамках единственного компьютера все равно применяется сеть для взаимодействия клиента и сервера. Кстати, следует отметить, что клиент и сервер могут работать под разными операционными системами, это ничему не мешает. MySQL уже доступен более чем под десятком операционных систем.

MySQL-является полностью многопоточной системой

Это означает, что пакет может легко использовать много процессоров, если они есть. На многих серверных системах уже ставят по несколько процессоров. На таких системах MySQL может строго параллельно выполнять сразу несколько запросов к базам данных (по одному на процессоре).

MySQL является пакетом с открытыми исходными текстами

Это означает, что пакет легко может модифицировать под свои нужды любой, кто достаточно хорошо разбирается в программировании. Написав важную поправку к пакету, такой специалист может выслать ее на основной сайт пакета для возможного включения в следующую версию. Именно благодаря такой схеме разработки MySQL развивается очень быстро и с учетом надобностей конечных пользователей, а все ошибки устраняются в кратчайшие сроки. Это свойство стало едва ли не первой причиной высокой популярности пакета: при должной квалификации его можно подогнать под свои задачи.

MySQL бесплатен в большинстве случаев

MySQL предназначен для некоммерческого использования. Если вы применяете пакет для организации форума, системы гостевых книг или блогов, то вы не должны платить ни за какие лицензии. Достаточно просто скачать пакет с его сайта и поставить на ваш сервер. Но если вам нужна техническая поддержка, то вот за нее-то придется заплатить. Обратите внимание: плата берется именно за техническую поддержку, а не за использование самой программы. Именно это свойство во многом обеспечило этой СУБД столь высокую популярность.

Теперь рассмотрим более подробно абсолютно необходимую терминологию, которая понадобится при последующем изложении, а также основные принципы работы баз данных, чтобы вы хотя бы в общих чертах представляли, с чем имеете дело. На первый взгляд, перечень терминов длинный, но все они понадобятся.

Поскольку все данные хранятся в виде таблиц, следует четко определиться с видом таблиц и соответствующей терминологией. Таблица состоит из ячеек , каждая из которых может хранить некоторые данные. Если ячейка никаких данных в настоящий момент не хранит, она называется пустой.

Таблица состоит из вертикальных столбцов и горизонтальных строк, в которые сгруппированы ячейки. Таблица строго прямоугольная , то есть во всех строках одинаковое число ячеек, а во всех столбцах одинаковое количество строк.

Каждая строка в таблице называется записью . Каждая ячейка в записи именуется полем записи . Поскольку поля могут хранить самые разнообразные данные, для упрощения работы с ними введено понятие типа . Каждая ячейка имеет свой тип и может хранить только данные соответствующего типа, что необходимо понимать при работе с системой.

В MySQL принято, что тип данных присваивается столбцу в таблице и распространяется на все ячейки в этом столбце. То есть, если первому столбцу присвоен некий тип (например, char), то это значит, что первое поле любой записи в этой таблице всегда будет иметь именно тип char и никакой иной.

Это очень важно! Большую часть времени вы будете работать со столбцами, поскольку именно они определяют тип данных и структуру таблицы. Строки в таблице не нумеруются, они существуют только для простоты работы с данными. В большинстве случаев количество записей в таблице вас вообще не должно интересовать. Вы работаете с данными, а их структура определена типами и порядком следования столбцов. Количество записей важно только для сервера.

База данных может состоять из нескольких разных таблиц. Их точное количество ограничено, главным образом, памятью компьютера. Сервер может хранить много баз данных. Следует отметить, что вы можете смешивать таблицы из разных баз данных в одном запросе.

Таблица также имеет тип и атрибуты . От этого зависит набор возможностей, доступных при работе с этой таблицей, а также логика ее обработки сервером. Это будет подробно рассмотрено позднее.

Теперь поговорим о данных в полях. Чтобы что-то сделать с какими-то данными, их сначала надо найти. Для этого и используется язык SQL. На нем пишутся запросы, в процессе обработки которых сервер просматривает таблицы базы данных, находит по заданным в запросе критериям требуемые данные и что-то с ними делает (что именно, зависит от запроса).

Те данные, по которым производится поиск записи, называются ключом . Если в записи несколько полей, то найти ее можно по разным ключам, каждый для своего поля. Тот ключ, по которому с наибольшей вероятностью будет производиться поиск записи, называется первичным ключом (PRIMARYKEY). Ключ может относиться не только к одному полю, а сразу к нескольким.

По одному ключу можно найти одну или несколько записей. Если по некоему ключу может быть найдена только одна конкретная запись, такой ключ называют уникальным (UNIQUE). Ключ, подходящий для поиска нескольких различных записей в таблице, называется неуникальным.

Следующим понятием является индекс . Представьте себе, как работает сервер базы данных. Получив запрос, он начинает просматривать таблицы на предмет поиска соответствующих данных. Просмотр выполняется последовательно, строка за строкой. Чтобы удостовериться в том, что собраны все данные, сервер должен просмотреть все строки в таблице (или в таблицах, если поиск идет сразу по нескольким таблицам).

Но легко сказать: просмотреть. А если таблица включает десять тысяч записей? А если миллион? Сервер, конечно, ее просмотрит, но вот сколько времени у него на это уйдет? Немало. А ответ надо получить как можно быстрей.

Вот тут и приходят на помощь индексы. Индекс представляет собой нечто вроде оглавления, которое перечисляет, в каких именно записях встречаются некие данные. Можно сравнить с поиском в сети Интернет, где поисковые системы хранят данные о том, на каких страничках присутствуют те или иные слова. Индексы в MySQL делают то же самое. Индекс надо специально создать, сам по себе он не строится (как именно его создать, будет рассмотрено позже).

Процесс построения индекса занимает немало времени, но после его создания сервер уже не просматривает всю таблицу в поисках данных: Он ищет данные по индексу, где для каждого встречающегося в таблице значения указано, в каких именно ячейках таблицы можно найти нужные данные. Это существенно ускоряет работу (в десятки раз).

В разных запросах ищутся разные данные. Часто бывает необходимо иметь не один, а несколько разных индексов на таблицу, чтобы разные типы запросов работали каждый со своим индексом, оптимально созданным и подходящим именно для этого типа запросов. Например, представьте телефонную книгу. Когда в ней идет поиск по фамилии абонента, индекс должен указывать, в каких записях искать ту или иную фамилию. А вот если поиск ведется по имени, то индекс должен быть построен уже не по фамилиям, а по именам абонентов.

Получается, что для каждой таблицы порой следует иметь несколько разных индексов. В MySQL можно иметь до 32 индексов на таблицу. Максимальная индексная длина (то есть длина каждой записи в индексе) составляет до 500 байт. Индекс может включать в себя данные из нескольких столбцов сразу (в текущей реализации MySQL максимальное количество столбцов в каждом индексе составляет 15).

Поскольку индексы строятся по данным в полях записей, а каждое поле может быть рассмотрено как ключ, говорят, что индекс строится по ключам . Индекс, построенный по первичным ключам, будет использован при поиске с наибольшей вероятностью и называется первичным индексом .

Все столбцы имеют значения по умолчанию . Это значит, что если некоему полю явно не задано значение, оно будет установлено автоматически в некоторое значение, принятое по умолчанию, специфичное для каждого типа столбца. Значение по умолчанию можно сменить при создании столбца.

Каждый столбец в таблице имеет уникальное имя . Имена также имеют таблицы и базы данных. В ряде случаев, о которых речь пойдет ниже, столбец должен иметь несколько имен. В этом случае именем считается лишь то, которое присвоено столбцу при его создании, остальные называются псевдонимами. Встречаются также псевдонимы для имен таблиц.

Столбцы необязательно создаются вместе с таблицами. Таблицу можно менять по мере надобности, добавляя или удаляя столбцы, меняя их типы. В инструкциях SQL вы можете обращаться к таблицам из различных баз данных с помощью синтаксиса Имя_базы_данных.Имя_таблицы . Это длинное имя позволяет однозначно указать таблицу и называется полным именем таблицы .

Вы также можете обращаться к столбцу в любой таблице указанием синтаксиса Имя_базы_данных.Имя_таблицы.Имя_столбца . Такая конструкция позволяет однозначно опознать столбец и именуется полным именем столбца .

Столбцы помимо имени и типа могут также иметь необязательные атрибуты , которые определяют, как именно сервер обрабатывает тот или иной столбец, меняют логику работы сервера с этим столбцом. Присвоение атрибута столбцу равносильно присвоению этого атрибута соответствующему столбцу полю в каждой записи в таблице. Замечу, что столбцы одного типа, но с разными атрибутами, обрабатываются различными способами.

В ходе работы с СУБД какая-то база данных всегда считается активной или текущей . В ней существует некая активная таблица . Именно с активной таблицей в текущей базе данных будут производиться все действия, если вы явно не укажете иное.

При обращении к столбцу в активной таблице можно вместо его полного имени (с указанием базы данных и таблицы) указывать только имя столбца. Оно автоматически будет дополнено именем активной таблицы текущей базы данных, что существенно ускоряет процесс ввода. Также, если вы обращаетесь к столбцу из другой таблицы в текущей базе данных, то можно указать его имя как Имя_таблицы.Имя_столбца , опустив часть Имя_базы_данных. оно будет приравнено к текущей базе данных.

В дальнейшем изложении вам встретится понятие потока. Поток в этом руководстве по MySQL представляет собой ваше соединение с сервером базы данных. Все команды, которые вы вводите, относятся только к этому потоку. Обратите внимание, что если вы создали несколько разных соединений с одной базой данных (например, открыв несколько копий клиента), то каждое соединение будет совершенно самостоятельным потоком, ни в чем не зависящим от других. В этом и заключается серьезное отличие между пользователем и потоком: один пользователь может быть представлен несколькими независимыми потоками. Позже мы покажем, в какие ловушки это может завести.

Символы подстановки или групповые символы представляют собой такие символы, которым может соответствовать некое количество других символов. Например, при работе в Windows вы, скорее всего, сталкивались с символом звездочки (*), который обозначает любую цепочку произвольных символов. Такой метод широко применяется при работе с группами файлов. Вот это и есть групповой символ.

Регулярные выражения представляют собой некие последовательности символов, часть или все из которых являются символами подстановки. Например, при работе в Windows вы, скорее всего, сталкивались с обозначениями вида *.doc (соответствует всем файлам с расширением doc в текущем каталоге) или *.* (определяет все файлы в каталоге). Это и есть регулярные выражения, только в Windows их называют иначе. Как видите, ничего сложного в них нет. В MySQL вы не раз встретитесь с такими выражениями (правда, куца более сложными). Именно с их помощью задаются критерии для поиска информации.

Теперь давайте задумаемся о такой сложной проблеме: сервер допускает одновременную работу множества пользователей с одной и той же базой данных (даже с одной и той же таблицей). Но как обеспечить при этом целостность данных? Если один пользователь пишет одни данные, а другой в это же время пытается изменить именно эти данные, они разнесут всю базу данных. Как избежать этого?

Существуют два способа установить разделение, и MySQL применяет оба, правда на разных типах таблиц. Первый это транзакционная модель , второй атомные модификации .

Транзакцией именуется некая операция с базой данных, которая не может быть поделена на несколько раздельных операций. Полное описание двух перечисленных выше понятий очень сложно и в этой книге представляется излишним, поэтому мы рассмотрим их только с точки зрения пользователя.

Итак, как выглядит работа с транзакцией? Сервер представляет это так: сначала определяется, что именно в таблице будет изменено, затем делается отметка о том, что вот эти ячейки меняются некоторым образом, затем реально вносятся изменения, а потом ставится, отметка, что модификация выполнена. При этом на время внесения изменений таблица либо возвращает старые данные, либо не возвращает вообще ничего, но в любом случае не дает двум пользователям одновременно вносить изменения в одни и те же данные. Сначала первый заканчивает модификацию, потом за дело берется следующий.

Разница между транзакцией и атомной модификацией, если отбросить всю научную теорию, для конечного пользователя заключается в том, что в случае транзакционной модели пользователь может после выполнения запроса, который изменяет какие-то данные в таблице, решить, как именно он хочет завершить транзакцию: следует ли сохранить изменения (commit) или Отказаться от них (вызвать обратную перемотку, rollback ), вернув тем самым таблицу к тому состоянию, которое она имела до вызова запроса. Следует отметить, что существует режим автоматического сохранения всех изменений (AUTO_COMMIT). В атомной модели изменения отменены быть не могут: они вносятся в таблицу немедленно. Выполняемая в настоящий момент транзакция именуется активной.

MySQL по умолчанию использует свой формат таблиц: MyISAM. Раньше применялся тоже собственный формат ISAM, но теперь он объявлен устаревшим и поддерживается исключительно для совместимости со старыми пользователями. Если у вас есть таблицы в этом формате, мы очень рекомендуем конвертировать их в новый формат MyISAM. Он работает надежнее и быстрее.

Раз уж речь зашла о поддерживаемых форматах таблиц, следует сразу внести ясность на предмет того, что MySQL поддерживает несколько разных форматов. Одни работают на основе транзакций, другие на атомных модификациях, чтобы у конечного пользователя всегда был выбор, чем пользоваться. Надо отметить, что транзакционная модель намного сложнее в реализации, чем атомная, а поэтому поддержка транзакций в MySQL появилась существенно позднее. Свои форматы MySQL (MyISAM и ISAM) используют именно атомные модификации, но реализуют их настолько хорошо, что по надежности они ничем не уступают транзакционной модели доступа. В таблице 1.1. приведены поддерживаемые MySQL типы таблиц с их краткими описаниями.

Таблица 1.1. Краткие описания поддерживаемых MySQL типов таблиц.

Тип таблицы

Краткое описание

BDB или Berkeley_db

Транзакционно-безопасные таблицы с блокировкой страниц

HEAP

Данные для этих таблиц сохранены только в памяти (временные таблицы, но зато быстрые)

ISAM

Первоначальный драйвер таблицы MySQL. Устарел

InnoDB

Транзакционно-безопасные таблицы с блокировкой строки

MERGE

Совокупность таблиц MyISAM, используемых как одна

MyISAM

Новый двоично-независимый драйвер таблицы, который заменяет формат ISAM. Используется по умолчанию как основной тип таблицы

Обратите внимание, что не все версии сервера поддерживают все перечисленные таблицы! Типы ISAM и MyISAM поддерживаются всегда, а вот насчет остальных возможны варианты. Так что посмотрите на сайте http://www.mysql.com , что именно вам нужно.

Дампом называется некое промежуточное представление базы данных. Причем, обычно оговаривается то, какое именно представление данных имеется в виду. Например, дамп в текстовый файл означает, что вся база данных конвертируется и сохраняется в виде текстового файла.

Зачем это нужно? Дампы очень удобны для резервного копирования, а также для переноса данных между разными серверами. Может возникнуть необходимость применения дампа и в рамках одного сервера.

В таблице 1.1 показаны разные типы таблиц. Каждый из них имеет свой внутренний формат хранения данных. Самый простой способ конвертации одного в другой сводится к дампам.