Реляционные базы данных это одна из составляющих практически любого IT-проекта. В чём суть баз данных? Для чего они нужны?
Зачем нужна база данных?
Суть баз данных заключается в обеспечении удобного и эффективного способа хранения данных определённой структуры для IT-проектов. Чтобы было понятнее, рассмотрим пример:
Предположим у нас есть магазин, товарный ряд которого постоянно пополняется, и может меняться. Мы хотим разработать интернет-магазин, чтобы продавать товары онлайн. Если мы пропишем все товары в коде интернет-магазина, то для добавления или редактирования каждого товара нам придётся лезть в код, и копошиться в нём, чтобы совершить нужное действие.
Вместо этого мы можем хранить информацию о наших товарах в базе данных, а в коде интернет-магазина прописать получение товаров из базы. Теперь нам не нужно лезть в код, чтобы управлять товарами - мы можем либо управлять ими в интерфейсе СУБД (система управления базами данных), либо разработать систему управления контентом (CMS - content management system), чтобы через графический интерфейс легко и быстро производить все необходимые манипуляции с товарами.
Стоит упомянуть, что невозможно написать систему управления контентом, если у вас нет базы данных, а все товары прописаны в коде.
Базы данных позволяют организовать эффективный поиск, фильтрацию и сортировку данных. Они также обеспечивают механизмы для выполнения сложных запросов и аналитики данных.
Это означает, что мы можем записать несколько к примеру товаров, а получить данные только тех товаров название которых содержит определенное слово. Или цена которых больше или меньше определённого числа. Или товары которые добавлены раньше/позже определенной даты. Или одновременно применить все эти условия.
Таким образом, сами по себе базы данных предоставляют широкие возможности для того чтобы мы могли разработать сортировку, группировку и фильтрацию данных.
Также базы данных как правило приспособлены для хранения большого объёма данных, и работают очень быстро, что позволяет выполнять колоссальное количество обращений к БД в секунду. Это позволяет десяткам людей одновременно обращаться к базе данных, и они не будут тормозить.
Даже когда количество одновременных пользователей достигает больших значений, существуют различные техники оптимизации нагрузки, чтобы обеспечить стабильную работу без тормозов. Это называется масштабированием баз данных, и к этой теме мы ещё вернёмся в другой статье.
Что такое база данных с программной точки зрения?
Виды и типы баз данных бывают разные, но принцип один и тот же. Это программа, которую нужно установить на компьютер или сервер.
Программа должна быть запущена, чтобы можно было подключаться к базе, и производить в ней манипуляции с информацией. Когда база данных запущена, к ней можно подключиться - она доступна по определенному локальному IP-адресу и порту.
Также чтобы использовать БД, нужно настроить к ней доступ: для этого добавляются пользователи базы данных. При установке СУБД автоматически добавляется главный пользователь «root», позже можно добавить других пользователей, и даже настроить им разрешения: можно сделать например так, что если пользователь подключится к базе, он бы мог только читать данные, а записывать не мог.
Доступ каждого пользователя осуществляется по логину и паролю - вы же не хотите чтобы кто угодно имел полный доступ ко всем данным в базе. В большинстве случаев достаточно одного пользователя, через которого бэкенд будет взаимодействовать с базой.
Работа с базами данных происходит при помощи специальных команд, позволяющих выполнять классические операции получения, добавления, редактирования и удаления данных (сокращенно CRUD - create, read, update, delete).
Эти команды можно слать при помощи программного кода (самый распространённый случай, для чего нам база и нужна), также писать напрямую в консоль запущенной субд, либо используя графический интерфейс.
Все графические интерфейсы такие как Navicat, phpMyAdmin, и так далее под капотом просто шлют консольные команды в базу данных, и выводят результат в графический интерфейс.
Когда необходимо сделать базу данных доступной из интернета, это настраивается отдельно, но в этом случае нужно уделить особое внимание безопасности. В основном базу данных делают доступной напрямую из интернета в том случае, когда она размещена на отдельном сервере, который был приобретён исключительно для базы данных.
Более распространённый случай - когда на одном сервере располагается и база данных, и backend проекта (и возможно frontend тоже). В этом случае к базе не открывают прямой доступ из интернета. Бэкенд подключается к базе по локальной сети, и производит манипуляции с данными.
Клиентская часть проекта (фронтенд) вообще ничего не должен "знать" о том, где находится база данных и как к ней подключиться. Он отправляет запросы к бэкенду, бэкенд может производить строго прописанные в коде операции с данными, и никакие кроме них.
Структура данных в БД
Как же хранятся данные в БД? Каждая база данных содержит набор таблиц, записи в которых являются хранимыми данными. Прежде чем мы можем начать использовать базу данных в своём проекте, нам необходимо определить её структуру: следует разделить всю информацию которую мы планируем хранить на логические группы, и для каждой создать таблицу.
Возвращаясь к примеру интернет магазина, у нас может быть отдельная таблица для товаров, отдельная таблица для категорий к которым принадлежат товары, отдельная таблица для пользователей, отдельная таблица для заказов пользователей и так далее.
И для каждой таблицы следует продумать её «столбцы». Если мы собираемся хранить товары, какие данные мы будем хранить? Название? Да, один столбец. Стоимость? Да, ещё один столбец. Категорию товара? Да, значит ещё один столбец.
База данных не ограничивает нас, что захотим то и можем хранить, самое главное - заранее это определить и заложить в структуру базы данных. Мы можем создать любое необходимое нам количество таблиц, и количество столбцов в этих таблицах.
Когда мы записываем данные в таблицу, каждая запись - это строка. Она хранит информацию о каком то одном определенном объекте. В таблице с товарами каждая строка - это информация об одном конкретном товаре. Также каждая запись в базе данных как правило включает в себя ещё один столбец: ID, в котором хранится уникальный идентификатор (это может быть число, или хэш). В одной таблице нет повторяющихся ID, что позволяет зная ID конкретной записи со 100% точностью получить информацию именно об этой записи.
А почему реляционные? Что это вообще значит?
Relation в переводе с английского это связь. Реляционные базы данных предоставляют возможность устанавливать связи между различными таблицами, что позволяет эффективно организовывать данные. Это способствует избежанию дублирования информации и обеспечивает ее целостность.
Связи бывают разных типов, и на эту тему на нашей платформе есть несколько статей, по одной на каждый тип связи. Простыми словами и с примерами. Обязательно почитайте, если начали изучать базы данных!
Структуру базы данных необходимо продумать заранее!
Этап на котором мы определям структуру базы данных (какие там будут таблицы, и какие в таблицах будут столбцы) называется проектированием архитектуры базы данных. Он очень ответственный и серьёзный, потому что от правильного проектирования зависит будет ли проект функционировать должным образом и без тормозов даже при высокой нагрузке.
Если база данных спроектирована неверно, это может обнаружиться как сразу так и не сразу, и может повлечь за собой необходимость полностью переделать базу данных, что повлечёт необходимость и переписывать заново код взаимодействующий с базой.
Именно поэтому, чтобы избежать ошибок, и правильно продумать структуру базы данных, лучше вместо того чтобы создавать её консольными командами или в СУБД прямо во время разработки, проектировать базу данных используя специальные программы для проектирования БД.