|
|
Как лучше хранить информациюС каждым годом информации становится все больше: фото и видеоматериалы частных лиц, данные банков и телеком-операторов, результаты моделирования и многое другое. В связи с этим возникает задача не только хранить данные, но и иметь к ним доступ с определенной скоростью. Спрос на системы хранения данных и в мире, и в России, растет, и по ожиданиям IDC1 тенденция будет сохраняться. Насыщения этого рынка, по мнению экспертов, пока не предвидится. Даже несмотря на то, что в России, комментирует Андрей Серегин, ведущий аналитик IDC по рынку СХД и серверов, практически отсутствуют законодательные нормы, предписывающие правила хранения данных. И без этого у отечественного рынка достаточное количество стимулирующих факторов. Во-первых, ряд крупных российских компаний уже торгуют на нью-йоркской фондовой бирже, что обязывает их соответствовать американским законам о хранении информации. Во-вторых, для банков стран, входящих в ОЭСР, вступают в силу правила Basel II, регулирующие правила хранения корпоративной корреспонденции банков. Кроме того, в России в начале 2006 года выпущена новая версия стандарта информационной безопасности ЦБ РФ, рекомендующая банкам подходы к хранению корпоративной корреспонденции. Хранение архива электронной почты и документооборота были наиболее важными приоритетами финансирования в 2005-2006 гг. В-третьих, специфика использования электронных документов в качестве доказательной базы в судебных разбирательствах ведет к появлению новых услуг и практик в области хранения данных. Кроме непосредственного увеличения объемов данных, их приходится дольше хранить, что также положительно сказывается на количестве и емкости используемых устройств хранения. В последнее время стал актуален вопрос информационной безопасности — для обеспечения необходимого уровня решения усложняются. Это в свою очередь увеличивает объем данных на 30-40%. К тому же требуется обеспечить катастрофоустойчивое решение, т.е., как минимум, подразумевается использование резервных хранилищ. Динамика продаж дисковых систем, 2005-2010 (прогноз) Управление жизненным циклом информации Управлять нарастающими объемами данных становится все труднее. Даже повышение стоимости средств управления системами хранения данных не дает возможности реализовать высокую доступность информации, адекватную темпам развития бизнеса, и надежность хранения, соответствующую нормативным государственным актам. Решением этой проблемы является процесс управления жизненным циклом информации (ILM). ILM-стратегия для бизнеса предусматривает управление информацией с учетом изменения ее ценности во времени. Согласно этим принципам наиболее важная в текущий момент информация должна присутствовать в самой быстрой системе. Менее важная информация должна перемещаться в менее скоростную и более дешевую систему хранения, например, оптические носители. Архивы следует переписывать на магнитные ленты и удалять из рабочей СХД, чтобы не снижалась скорость доступа к критичной информации, и обеспечивалась минимальная стоимость хранения. Ненужная в будущем информация должна удаляться автоматически. Все перечисленные процессы движения информации вверх и вниз должны быть непрерывными. ILM должна базироваться на инфраструктуре хранения из устройств разных классов, использовать программное обеспечение управления хранением и увязывать задачи управления инфраструктурой и бизнес-задачи. Требуется отслеживать необходимость и время нахождения данных на определенном уровне, частоту использования и т.д., при этом нужно отслеживать соответствие требуемой стоимости хранения и эффективности хранения на том или ином уровне. ILM-система каждого вендора, который продвигает эту концепцию, состоит из множества модулей, которые охватывают весь спектр операций с данными: решение вопросов, связанных с соответствием политик сохранения данных внешним требованиям; предоставление советов, основанных на опыте работы в отрасли; резервирование и восстановление данных; идентификация наследуемой информации в новую среду ILM, определение стратегии миграции и сама миграция; копирование данных в архивное хранилище; аудит системы хранения; разработка информационных политик, соответствующих требованиям нормативных актов и т.д. вплоть до гарантированного удаления данных. Суммарная емкость поставок СХД в Россию Можно рассмотреть проекцию концепции ILM на управление файлами, находящимися на домашнем компьютере пользователей. Если с каким-либо документом пользователь работает в настоящее время, то файл находится на рабочем столе или в легко доступной папке, затем файл либо удаляется, либо отправляется в архив. Фильмы, скаченные из локальной сети, либо удаляются после просмотра, либо, самые интересные, переписываются на оптические носители. Фотографии из туристических поездок очень часто просматриваются в первые пару недель, затем в течение долго времени лежат нетронутыми, что также побуждает некоторых пользователей при недостатке места на жестком диске переносить их на оптические носители. Многие помнят то время, когда в качестве архивного хранилища данных использовался стример на основе видеомагнитофона, с помощью которого пользователи могли записывать до 2ГБ информации на видеокассету (в то время емкость жестких дисков не превышала 300МБ). Динамика ценности информации с течением времени Со временем ценность информации повышается или понижается. Кроме типа информации, на ее ценность влияют многие другие факторы, например, полученные в один и тот же день личное письмо о вечерней встрече и письмо, которое может оказаться важным документом в судебном деле, через некоторое время имеют различную ценность. В зависимости от различной ценности, информация должна быть в разной степени доступна и защищена. В этом и состоит суть ILM. Виртуализация СХД Важный тренд на рынке систем хранения данных — это виртуализация, то есть преобразование физических связей между серверами и СХД в логические. Специалисты проводят параллели с коммунальными службами: водоснабжением, отоплением, подводом электричества, газа. «Серверами» здесь «являются» водонапорная башня, котельная, электростанция и т.д. А системами хранения данных, а точнее потребления ресурсов - квартиры. Нет необходимости вести отдельный водопровод, электрический кабель, трубу отопления, газовую трубу в каждую квартиру. С точки зрения потребителей, это удобно. А с точки зрения коммунальных служб, сокращаются затраты на эксплуатацию — нет необходимости устранять вышедшие из строя некоторые из многочисленных элементов. Виртуализация СХД также при определенном количестве информации, пожалуй, является чуть ли не единственным выходом. Подобные решения при разумном внедрении позволяют экономить средства за счет сокращения расходов на эксплуатацию. Пока же ввиду не очень широкого распространения технологии цена виртуализации достаточно высока. Специалистами называются цифры от 200 тыс. долл. за решение. Ожидается, правда, что нижняя планка стоимости будет со временем снижаться. Виртуализация: этапы развития технологии К преимуществам виртуализированных СХД можно отнести возможность использования гетерогенной системы хранения, то есть оборудования хранения от разных производителей. Другой существенный плюс — возможность перезаписи с одной системы хранения на другую без выключения системы и, самое главное, незаметно для пользователей. Один из вопросов, которые возникают у потребителей, затрагивает надежность системы, а именно - не снизится ли надежность из-за появления центрального элемента, при выходе из строя которого падает вся система. Андрей Иванов, ведущий инженер Trinity, считает, что «надежность системы будет определяться надежностью самого "слабого" элемента комплекса, а это, скорее всего, будет не система виртуализации. Подавляющее большинство систем виртуализации не имеют в своем составе единой точки отказа, поэтому при правильном планировании решения вероятность выхода системы из строя целиком весьма мала. Всегда очень важно понимать, какой именно уровень отказоустойчивости необходим для того или иного решения. Например, если у нас есть только один дата-центр, то всегда есть возможность потерять все данные вместе с самим дата-центром. Именно поэтому, если важна максимально высокая доступность сервисов, требуется построение как минимум одной резервной площадки и репликация данных на нее. В этом случае, если система виртуализации выйдет из строя, то мы будем иметь возможность запустить необходимые сервисы на удаленной площадке. В случае же, если у нас только один дата-центр, то выход из строя системы виртуализации (впрочем, как и выход из строя системы хранения данных, на которой расположены те или иные данные) повлечет остановку в обслуживании до устранения неполадок и, возможно, определенные процедуры по восстановлению данных». По некоторым соображениям может упасть скорость системы, так как при добавлении новых устройств теоретически должно увеличиваться время прохождения сигнала от сервера к системе хранения. Эти опасения напрасны, так как, благодаря огромной cash-памяти контроллеров, задержки совершенно незаметны. Пока что технология виртуализации СХД достаточно молода. Однако, преимущества, которые она дает, заинтересованность в производителей и отсутствие альтернативы, вероятнее всего, обеспечат ей технологии бурное развитие. Тагир Мустафин 1 По материалам конференции IDC http://www.idc-cema.com/?showproduct=29989&content_lang=RU |