Очередная тесно связанная с виртуализацией сфера, в которой грядут стратегические перемены, - это устройства хранения данных, от прозаических жёстких дисков и флэшек до множества корпоративных накопителей, реализующих весьма оригинальные и инновационные схемы записи и считывания данных.
Маскируем данные
Идея ввести технологии виртуализации в сферу хранения данных реализована уже давно. Известно несколько технических схем виртуализации данных: на уровне сервера (например, сетевые хранилища), на уровне системы хранения (сетевые файловые системы) и на уровне сети хранения. Главная же их идея - маскировка подчас довольно сложной системы хранения от конечных потребителей, представление её в виде одного логического устройства. Подобное абстрактное представление обычно реализуется двумя распространёнными способами, зависящими от наличия "легаси"-оборудования. Если унаследованных систем хранения много, то акцент в ходе создания единого пула делается на оптимизации управления всем "зоопарком" (что далеко не всегда, кстати, возможно технически). Если же система создаётся новая, то обычно приобретается виртуальный кластер хранения данных, как правило, построенный на однотипных устройствах, но при этом зачастую привязанный к конкретному вендору. Главное же в этих способах виртуализации - отделение "объёмов" хранения от физических носителей.
Этот шаг к идеальной виртуализации, однако, далеко не последний. Да, формирование единого виртуального пула хранения обеспечивает хорошую масштабируемость (чтобы расширить ёмкость, достаточно добавить новое устройство без излишнего его конфигурирования), упрощает обслуживание и т. д. Однако и тут без балансировки работы такого пула не обойтись - все равно надо учитывать реальные потребности предприятия и его планы развития и находить наиболее выгодные схемы внедрения и эксплуатации. Фактически большинство таких проектов, если они крупные, до промышленной эксплуатации надо доводить вручную. Но удобство централизованного управления виртуальными устройствами хранения даёт несомненную выгоду. Более того, оптимизированные виртуальные диски подчас существенно превосходят физические накопителя по скорости.
А надо ли виртуализироваться?
Но может быть, виртуальные системы хранения скоро отомрут? Например, придумают какие-нибудь суперкомпактные сверхбыстрые накопители невообразимого объёма, и вся эта виртуализация потеряет смысл? Так наверняка и случится, но совсем ещё не скоро. Даже твердотельные накопители пока не слишком быстро приближаются к классическим жёстким дискам: по оценкам IDC, ценовой разрыв между флэш- и классическими дисковыми накопителями сохранится как минимум до 2016 г. Так, твердотельный диск PCIe MLC обойдётся в десятки раз дороже аналогичного SATA по удельной стоимости гигабайта, и в ближайшие три-четыре года этот разрыв вряд ли составит менее 5-10 крат. Хотя появятся гибридные версии, оптимизированные под использование флэша, ну и сам рынок классических систем хранения данных растёт активно: увеличение суммарной ёмкости проданных накопителей в четвёртом квартале 2012-го составило 34% по сравнению с аналогичным кварталом 2011 г. Так что определённая пестрота в этой сфере сохранится ещё не менее десяти лет - соответственно и актуальность виртуализации будет только расти.
Чем плохи виртуальные диски?
Чем же тогда недовольны потребители систем хранения? Недовольными в прошлом году их сделала корпорация VMware, фактически декларировав новый стратегический тренд - программно-управляемые ЦОДы (software defined data center, SDDC). Фактически сразу после приобретения ею крепкого, но малоизвестного разработчика программно-управляемых сетей Nicira за 1,2 млрд. долл. и пошли разговоры сперва о SDDC, а затем о программно-управляемых сетях (software defined network, SDN), а теперь и о программно-управляемых хранилищах данных (software defined storage, SDS) - и тут же об открытом облачном стандарте OpenStack.
Концепция SDDC подразумевает универсальные программные интерфейсы для использования виртуальных хранилищ внутри программно-управляемых ЦОДов, но существовавшие в то время технологии виртуализации друг с другом фактически никак не состыковывались. Они хорошо работали с "зоопарком" оборудования, однако не было технологии, способной работать с "зоопарком" виртуальных пулов. Причём задача эта оказалась очень сложной технически - специалисты говорят, что она даже потруднее в реализации, нежели SDN.
SDS абстрагирует функции хранения данных
SDS далеко отошла от классической виртуализации, это уже целое технологическое направление по отделению логической функции хранения от физических носителей. Речь идёт о полном абстрагировании функций хранения данных от аппаратной части и организации доступа к ним через унифицированные программные интерфейсы. SDS предлагает взглянуть на хранилища данных не с точки зрения физического диска или флэшки, а в терминах его функциональности, отделяемой от аппаратной реализации. Условно говоря, в SDS можно "конвертировать" и обычную сеть, если к ней можно будет обращаться по унифицированному интерфейсу системы хранения SDS.
Стратегических плюсов тут множество:
- переход на более высокий уровень абстракции (виртуальный том, виртуальная файловая система) в контрасте с классическими "низкоуровневыми" виртуальными дисками;
- возможность применять к программно определяемой функциональности SDS классические соглашения об уровне обслуживания SLA, скрывая при этом технические нюансы работы аппаратуры;
- поставка функций хранения в виде сервисов;
- неограниченная масштабируемость путём подключения произвольных носителей, в том числе и удалённых, в горячем режиме через открытые API.
Ещё одно важнейшее преимущество - это интеллектуальность SDS, так как подобный программно-управляемый накопитель будет представлять собой систему из устройства управления, гипервизора, сервера, хранилища данных и сетевых адаптеров. Появятся и гибридные модели, когда управляющее ПО, поддерживающее внешние API SDS, будет встраиваться непосредственно в физические накопители, что избавит айтишников от вечной борьбы с множеством несовместимых аппаратных интерфейсов устройств хранения.
Рынок SDS ещё очень юн
Эксперты называют 2012-й годом программно-управляемых сетей, а нынешний уже объявили годом программно-управляемых хранилищ данных. Оценить этот пока только зарождающийся рынок SDS сейчас вряд ли возможно, поэтому и лидеры тут скорее потенциальные. Nicira со своими технологиями SDN была известна довольно узкому кругу специалистов, и в сфере SDS тоже можно ожидать как неожиданных стартов малоизвестных фирм с хорошими нишевыми технологиями (отмечу, в частности, Tintri и Simplify), так и прогнозируемо сильных шагов ведущих корпораций, заинтересованных в развитии ЦОДов нового поколения и связанных с ними новых программных подходов (Cisco, IBM, Microsoft и т. д.). Пока же явным лидером остаётся компания EMC, которая совместно с VMware обещает открытые интерфейсы программирования для SDS-систем уже во втором полугодии 2013-го. Она, в частности, подтвердила, что создаёт платформу объектного хранения данных на базе Hadoop Distributed File System и особое внимание уделяет облачной технологии OpenStack, для которой выпустит драйверы и программные расширения под системы хранения данных.