Для зарегистрированных пользователей |
|
Хранение данных: дооблачный и облачный подходы
В некоторых компаниях, под почтовые ящики пользователей до сих пор выделяют менее 1 Гб. Удивительно, но приходится слышать: «Ты мне на рабочий не высылай, шли на личный». Впрочем, в последнее время все реже, с одной стороны личные адреса все чаще возвращаются на корпоративные визитки, с другой стороны объемы и возможности корпоративных почтовых ящиков все ближе к тому, что предлагают публичные сервисы частным пользователям. Вообще маленькие размеры ящиков - это же действительно очень удобно. Заставляет избавляться от разного мусора, сортировать архивы. Посмотрите, что у вас в электронной почте. Приглашения на новогоднюю корпоративную вечеринку с огромной открыткой, куча черновиков презентаций среди которых не найдешь финальный вариант, письма по проектам завершенным месяцы назад и т.д. Почему мы их не удаляем? Да потому что боимся, что когда-нибудь нам может потребоваться письмо, файл, документ или запись (хотя для чего может потребоваться приглашение на вечеринку?).
Приглашение - особо показательный случай. Оно же есть в каждом почтовом ящике компании, вместе с другими общекорпоративными рассылками. Да, собственно половина почтового ящика именно такими данными и забита и чем больше ящик, тем больше в нем накапливается подобный мусор. В масштабе компании все это складывается в значительные объемы и деньги.
Все данные, которые хранятся в компании можно разделить на четыре категории:
- постоянно используемые;
- часто используемые;
- редко используемые;
- никогда не используемые.
В дооблачную эпоху все было просто. Постоянно используемые данные размещались на быстрых накопителях, часто используемые - на более медленных жестких дисках. С редко используемыми данными сложнее. С одной стороны востребованность резервных копий может быть не очень высока, и пользователь вполне может подождать некоторое время (соответствующее SLA ИТ-службы) пока ему восстановят внезапно ставший очень нужным файл. С другой стороны, многие данные в компании приходится хранить только по требованию регуляторов. Вероятность того, что они когда-либо будут востребованы еще ниже, чем с резервными копиями. В целом часть редко используемых данных тоже приходится хранить на жестких дисках, а для другой части долгое время лучшим решением были ленточные накопители. Впрочем, в настоящее время они в ценовой войне безнадежно уступили NAS-решениям на все тех же обычных жестких дисках.
Ну и последняя категория фактически - это данные подлежащие немедленному удалению. Главное тут не ошибиться с определением категории, впрочем, 100% общекорпоративных рассылок сюда попадает.
Расширение цифровой вселенной
Данных с каждым годом становится все больше. Объемы данных непрерывно растут и более того скорость их прироста постоянно увеличивается. Исследование IDC Digital Universe Study говорит о том, что в 2011 году в мире было произведено 1,8 Зетабайт данных или 1,8 триллиона Гигабайт, в единицах, которые пока нам более привычны. В 2012 было создано уже 2.8 Зетабайт - привет YouTube, Facebook и другому медиаконтенту, который генерируют пользователи, однако большую часть из этого дополнительного Зетабайта составили данные сгенерированные машинами для общения друг с другом. К 2020 году машиногенерируемые данные вырастут в 15 раз. А всего человечество и его роботы к 2020 году произведут более 40 Зетабайт разного рода данных. Причем этот прогноз ежегодно корректируется в большую сторону.
В корпоративном секторе объемы данных растут немного медленнее. Но все равно, компаниям со временем придется покупать все больше и больше медленных HDD. Все больше NAS, чтобы размещать эти HDD. Все больше оборудованных помещений для установки NAS и т.д. Объем инвестиций в хранение данных едва ли не превышает ценность самих данных, поскольку объемы данных постоянно увеличиваются.
И тут появляются облака
Ценообразование облачных провайдеров обычно складывается из объема хранимых данных, загрузки процессора и трафика. Очевидное решение - вынести в облако редко и никогда не используемые данные. Учитывая характер таких данных скорость доступа к ним не так уж и важна. Сегодня хранение 1Тб в облаке обойдется примерно в 100$ за месяц - примерно за те же деньги можно купить в «вечное» пользование жесткий диск того же объема. Проблема в том, что HDD так дешево будет стоить только, если на нем хранить никогда не используемые данные - слить на него все, что можно и засунуть на полку в темный пыльный неотапливаемый чулан к еще сотне таких же. А через несколько лет можно устроить рекорд по скорости беспроводной передачи данных - загрузить несколько петабайт неизвестно чего в КАМАЗ и на скорости 60 км/час вывезти на свалку. Скорость передачи данных в облако обычно намного меньше.
Ключевое отличие редко используемых данных от неиспользуемых данных в том, что иногда они иногда все же оказываются востребованными. Более того востребованность подобных данных постепенно растет. Появляются такие концепции, как Big Data, предполагающие поиск закономерностей в тех огромных массивах данных, которые накапливаются в компаниях. Кому, несколько лет назад приходила в голову идея искать закономерности, например, в данных по транзакциям компании. А кто мог позволить себе дата-центры позволяющие перемалывать такие объемы информации? Облачные хранилища позволяют обрабатывать и сортировать данные намного проще и дешевле.
В итоге, постоянно используемые данные по прежнему хранятся на самых быстрых из возможных носителей (сегодня тут лидирует технология SSD), большие объемы часто используемых данных на HDD в разного рода SAN и NAS. А вот лучшее место для редко используемых данных - облако. По сути, облако - идеальный бесконечный архив.
Правда есть еще самый популярный вопрос в отношении передачи данных в любые публичные облака: «Неужели вы не беспокоитесь о безопасности и защите данных?» Конечно, я думаю, что система ИТ-безопасности у большинства облачных провайдеров лучше, чем у обычных компаний (по крайней мере, так должно быть). Кроме того, публичные облачные провайдеры крайне заинтересованы в сохранении собственной репутации, т.к. их облачный бизнес существует ровно до того момента, пока пользователи понимают, что их данные в безопасности. Случись, массовый зафиксированный слив данных от внутренних служб облачного провайдера к третьей стороне и с облачной отраслью произойдет тоже, что и с Кипром. И наконец, я верю в стойкость современных алгоритмов шифрования.
Что случилось с корпоративной почтой
Так, что с приглашением на новогоднюю вечеринку, которое получили тысячи сотрудников компании и, которое они не удалили из почтового ящика. А это уже и не важно. С какого-то момента многие компании перешли на Exchange Online, Google Apps и другие сервисы, которые позволили даже небольшим компаниям скачкообразно увеличить объемы корпоративных ящиков до десятков гигабайт. Да и объемы хранилищ данных, подключаемых к почтовым серверам in house, вполне позволяют не столь жестко ограничивать пользователей.
|