5. Накопители информации

К техническим средствам накопления и хранения данных относятся различные соответствующие устройства. В компьютерных информационных технологиях это магнитные, оптические, магнитооптические и твердотельные носители электронных данных.

Оптический диск (optical disc) — собирательное название для носителей информации, выполненных в виде дисков, чтение с которых ведется с помощью оптического излучения. Диск обычно плоский, его основа сделана из поликарбоната, на который нанесен специальный слой, служащий для хранения информации. Для считывания информации обычно используется луч лазера, который направляется на специальный слой и отражается от него.

Компакт-диск был разработан в 1979 г. компаниями Philips и Sony.

Blu-rау Disc — формат оптического носителя, используемый для записи с повышенной плотностью и хранения цифровых данных, включая видео высокой четкости. Стандарт Blu-гау был совместно разработан консорциумом BDA, Первый прототип нового носителя был представлен в октябре 2000 г. Blu-гау (буквально «синий луч») получил свое название от использования для записи и чтения коротковолнового (405 нм) «синего» (технически сине-фиолетового) лазера.

Для организации надежного (и, как правило, длительного) сохранения электронных данных применяют различные виды копирования и архивирования информации.

Архивное копирование — процесс создания копий файлов, предназначенных для бессрочного или долговременного хранения. Носители, на которых они хранятся, называют архивными.

Под резервным копированием следует понимать создание копий файлов с целях быстрого восстановления работоспособности системы в случае возникновения аварийной ситуации. Для обеспечения надежности защиты данных желательно иметь по три резервных копии последних редакций файлов. Резервное копирование может быть полным, инкрементальным и дифференциальным.

Для накопления и хранения огромных массивов данных в локальной, глобальной и иных компьютерных информационных сетях их размещают в накопителях, расположенных на серверах или подключенных к ним.

К техническим устройствам, обеспечивающим корпоративные накопители информации, данных и знаний, относят RAID-системы (массивы), библиотеки оптических дисков («роботизированные библиотеки») и др.

RAID (Redundant Array of Inexpensive Disks, в некоторых редакциях — Redundant Arrays of Independent Disks) — избыточный массив независимых дисков. RAID-система представляет собой объединенную в одно устройство «этажерку» жестких магнитных дисков, управляемых специальным контроллером, рассматривающим их как единый логический накопитель информации.

Калифорнийский университет в Беркли представил следующие уровни спецификации RAID, которые были приняты как стандарт де-факто:

RAID 0 — представлен как дисковый массив повышенной производительности и меньшей отказоустойчивости;

RAID 1 — определен как зеркальный дисковый массив;

RAID 2 — зарезервирован для массивов, которые применяют код Хемминга;

RAID 3 и 4 — используют массив дисков с чередованием и выделенным диском четности;

RAID 5 — использует массив дисков с чередованием и невыделенным диском четности;

RAID 6 — использует массив дисков с чередованием и двумя независимыми четностями блоков;

RAID 10 — RAID 0, построенный из массивов RAID 1;

RAID 50 — RAID 0, построенный из массивов RAID 5;

RAID 60 — RAID 0, построенный из массивов RAID 6.

RAID 0 (striping — чередование) — дисковый массив из двух или более жестких дисков с отсутствием резервирования (рисунок 5.1). Информация разбивается на блоки данных (А,) и записывается на оба или несколько дисков одновременно.

Достоинство RAID 0 состоит в том, что существенно повышается производительность (от количества дисков зависит кратность увеличения производительности). Однако надежность RAID 0 заведомо ниже надежности любого из дисков в отдельности и снижается с увеличением количества входящих в RAID 0 дисков, так как отказ любого из дисков приводит к неработоспособности всего массива.

RAID 6 (mirroring — зеркалирование). Обеспечивает приемлемую скорость записи и выигрыш по скорости чтения при распараллеливании запросов. RAID 1 имеет высокую надежность — работает до тех пор, пока функционирует хотя бы один диск в массиве.

В массивах типа RAID 2 диски делятся на две группы — для данных и для кодов коррекции ошибок, причем если данные хранятся на л дисках, то для хранения кодов коррекции необходимо л — 1 дисков. Данные записываются на соответствующие диски так же, как и в RAID 0. Они разбиваются на небольшие блоки по числу дисков, предназначенных для хранения информации. Оставшиеся диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо жесткого диска из строя возможно восстановление информации. Недостаток массива RAID 2 состоит в том, что для его функционирования нужна структура из почти двойного количества дисков, поэтому такой вид массива не получил распространения.

В массиве RAID 3 из n дисков данные разбиваются на блоки размером 1 байт и распределяются по n - 1 дискам. Еще один диск используется для хранения блоков четности. В отличие от RAID 2 для RAID 3 невозможны коррекция ошибок «на лету» и меньшая избыточность.

Достоинства RAID 3:

Высокая скорость чтения и записи данных;
Минимальное количество дисков для создания массива равно трем.

Недостатки RAID 3:

Массив этого типа хорош только для однозадачной работы с большими файлами, так как время доступа к отдельному сектору, разбитому по дискам, равно максимальному из интервалов доступа к секторам каждого из дисков. Для блоков малого размера время доступа намного больше времени чтения;
Большая нагрузка на контрольный диск и, как следствие, сильное снижение его надежности по сравнению с дисками, хранящими данные.

RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объема. Запись же производится медленно из-за того, что четность для блока генерируется при записи и записывается на единственный диск. Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о четности используется отдельный контрольный диск.

RAID 5 (рис. 5.2) не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее ИЛИ). XOR обладает особенностью, которая применяется в RAID 5, дающей возможность заменить любой операнд результатом, и применив алгоритм XOR, получить в итоге недостающий операнд.

Рисунок 5.2. – Схема RAID 5

RAID 6 похож на RAID 5, но имеет более высокую степень надежности — под контрольные суммы выделяется емкость двух дисков, рассчитываются две суммы по разным алгоритмам. Требует более мощный RAID-контроллер. Обеспечивает работоспособность после одновременного выхода из строя двух дисков — защита от кратного отказа. Для организации массива требуется минимум четыре диска.

RAID 7 — зарегистрированная торговая марка компании Storage Computer Corporation — отдельным уровнем RAID не является. Структура массива такова: на n - 1 дисках хранятся данные, один диск используется для складирования блоков четности. Запись на диски кешируется с использованием оперативной памяти, сам массив требует обязательного источника бесперебойного питания; в случае перебоев с питанием происходит повреждение данных.

RAID 10 — зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как в RAID 0. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. Соответственно массив этого уровня должен содержать как минимум четыре диска. RAID 10 объединяет в себе высокую отказоустойчивость и производительность.

При использовании сетевых технологий для хранения информации применяют различные информационные хранилища — базы обобщенных данных (Date Warehouse — DW), формируемые из множества различных внешних и внутренних источников. Основная цель информационного хранилища — создание единого логического представления данных, содержащихся в разнотипных базах данных, или единой модели корпоративных данных. Это могут быть сети хранения данных, которые формируются из множества различных внешних и внутренних источников.

Для сохранности электронных информационных ресурсов применяют и сети хранения данных типа SAN (Storage Area Network). Построение таких сетей требует значительных первоначальных затрат и не всегда оправдано.

Флеш-память (flash-memory) — разновидность твердотельной полупроводниковой энергонезависимой перезаписываемой памяти, работающей одновременно подобно оперативной памяти и жесткому магнитному диску.

Флеш-память (рисунок 5.3) исторически происходит от памяти ROM (Read Only Memory) и функционирует подобно RAM (Random Access Memory). Данные хранятся в ячейках памяти, похожих на ячейки оперативной памяти. В отличие от оперативной памяти при отключении питания данные из флеш-памяти не пропадают. У флеш-памяти существует возможность производить стирание отдельной ячейки с помощью электрического тока.

Рисунок 5.3 – Флеш-память

Основное преимущество флеш-памяти перед жесткими дисками и носителями CD-ROM состоит в том, что флеш-память потребляет значительно (примерно в 10— 20 и более раз) меньше энергии во время работы.

В устройствах CD-ROM, жестких дисках, кассетах и других механических носителях информации большая часть энергии уходит на приведение в движение механики этих устройств. Кроме того, флеш-память компактнее большинства других механических носителей.

Полупроводниковый накопитель SSD (Solid-State Drive) — энергонезависимое перезаписываемое компьютерное запоминающее устройство без движущихся механических частей.

Преимущества полупроводниковых накопителей по сравнению с жесткими дисками:

Отсутствие подвижных частей;
Задержка в режиме чтения 85 мкс, в режиме записи 115 мкс (50 нм — технологический процесс);
Задержка в режиме чтения 65 мкс, в режиме записи 85 мкс (34 нм — технологический процесс);
Скорость чтения и записи ограничена лишь пропускной способностью интерфейса и применяемых контроллеров. Так, OCZ RevoDrive Х2 имеет скорость чтения до 740 М Бит/с и скорость записи до 730 МБит/с;
Низкая потребляемая мощность;
Полное отсутствие шума от движущихся частей и охлаждающих вентиляторов;
Высокая механическая стойкость;
Широкий диапазон рабочих температур;
Стабильность времени считывания файлов независимо от их расположения или фрагментации;
Малые габаритные размеры и масса.

Недостатки полупроводниковых накопителей:

Ограниченное количество циклов перезаписи: обычная флеш-память позволяет записывать данные примерно 10 000 раз, более дорогостоящие виды памяти (SLC) — более 100 000 раз;
Высокая цена за 1 Гбайт (от 2 долл., при примерно 8 центах для жестких дисков за 1 Гбайт);
Стоимость SSD-накопителей прямо пропорциональна емкости, в то время как стоимость традиционных жестких дисков зависит 74 от количества пластин и медленнее растет при увеличении объема диска.

Предыдущая глава

Следующая глава

Технические средства информатизации

Электронное пособие по дисциплине "Технические средства информатизации"

5. Накопители информации

Содержание