Журнал "Системы Безопасности" № 6‘2021
Ц И Ф Р О В А Я Т Р А Н С Ф О Р М А Ц И Я , A I , I o T 76 декабрь 2021 – январь 2022 www.secuteck.ru СПЕЦПРОЕКТ СИСТЕМы ХРАНЕНИя ДАННыХ как можно более производительное "железо" и для начала разместить все данные на быстрых накопителях, в качестве которых могут выступать обычные или NVMe твердотельные диски. Вари- ант этот рабочий, но, во-первых, приличнее бьет по бюджету в сравнении со шпиндельными дис- ками, а во-вторых сохраняет ограничения про- изводительности при масштабировании. Если ваши объемы ограничены несколькими базами данных, десятками терабайт, тысячами объектов, возможно, проблем вы и не увидите. А если объ- ектов миллионы? Миллиарды? Отсюда возникает второй подход – использовать умное распределение данных по быстрым и медленным носителям информации и пони- мать взаимосвязи между различными частями данных. Алгоритмы здесь могут быть внешними: берем много наборов недорогого медленного "железа", поменьше – дорогого и быстрого и распределяем данные между ними с помощью программного обеспечения. В каком-то смысле такой подход используют и программно-опреде- ляемые решения (SDS), и платформы вроде Hadoop. Альтернатива – наличие таких умных алгоритмов внутри СХД. Быстрым типом данных здесь могут выступать как те же твердотельные накопители, так и оперативная память или дан- ные типа Storage Class Memory (SCM), что позво- ляет еще больше ускорить доступ к информации. В алгоритмах размещения данных внутри СХД на протяжении последних лет также наметился тренд использования искусственного интеллек- та. Большинство производителей систем хране- ния так или иначе начинают внедрять эти тех- нологии в свои решения. Развитие искусствен- ного интеллекта достигло такого уровня, что его применение дает реальный эффект: системы хранения непрерывно анализируют векторы активности данных и свое состояние, динами- чески адаптируясь к различным рабочим нагрузкам и заранее предупреждая админи- страторов СХД о возможных проблемах. При этом если обычно при росте объемов информа- ции производительность систем хранения начи- нала деградировать, то для алгоритмов искус- ственного интеллекта это только плюс. Чем больше данных, тем больше накопленной ста- тистики и выше вероятность предсказания, какие данные пойдут следом за изначально запрошенными. Наиболее логичным подходом для ускорения доступа к инфраструктуре хранения данных является совмещение описанных вариантов. Умные алгоритмы, безусловно, должны исполь- зоваться, но если бюджет позволяет их совме- стить с более производительным "железом", то эффект будет еще заметнее. Анна Балашова, Synology Риск потери данных может быть снижен за счет настройки отказоустойчивости системы. Это может быть, например, второй контроллер по архитектуре "активный – активный" или второе устройство по архитектуре "активный – пассив- ный". В первом случае простой составит пару секунд, во втором – пару минут. Решение оста- ется за клиентом. Если возможности создать отказоустойчивый кластер нет, то обязательной является настройка резервной копии. При этом необходимо пони- мать, что на восстановление из резервной копии потребуется некоторое время, в зависимости от того, как быстро сможет отреагировать систем- ный администратор компании, и от объема резервной копии. Например, восстановить уда- ленный кем-то конкретный файл – дело пары секунд. А вот восстановление полностью вирту- альной машины с диском на 2 Тбайт может занять пару часов. Существует большое количество вариантов резервного копирования для разных частей ИТ- инфраструктуры компании. Можно настроить моментальные снимки для данных, хранящихся на NAS, которые будут сохраняться на другой NAS и могут быть восстановлены на NAS или определенном ПК. Кроме того, можно настроить резервное копирование для вирту- альных машин, клиентов и других файловых серверов, а также таких SaaS, как Google Works- pace и Microsoft 365. Сергей Платонов, RAIDIX Конечно, ни одна защита со стороны СХД не избавляет от необходимости делать бэкап. А если говорить именно об СХД, то в контексте вопроса нужно рассматривать два типа архи- тектуры – Scale-In и Scale-Out. В первом случае есть два контроллера, которые дублируют друг друга и между которыми про- исходит зеркалирование кеша, а общие диски, как правило, объединены в RAID. Так как совре- менные диски растут в объемах, классические RAID уже не подходят. Способы повышения доступности данных заключаются в увеличении количества контрольных сумм (это реализова- но, например, в RAID 7.3 и RAID N+M) либо в сокращении времени восстановления за счет декластеризации. Что касается Scale-Out СХД, то здесь имеются два способа защиты – репликация данных между контроллерами либо Erasure Coding, при кото- ром информация делится на отдельные части, а позже к ним добавляются контрольные суммы и происходит распределение по разным узлам. В любом случае важно не забывать об элемен- тарных вещах, таких как обеспечение беспере- бойности электропитания. Дмитрий Огородников, СИТРОНИКС Традиционная технология, обеспечивающая сохранность данных при выходе из строя устройств хранения, – это RAID (Redundant Array of Independent Disks). Она объединяет в один логический модуль или виртуальный диск несколько физических дисков для повышения отказоустойчивости хранения и производительности при обработке данных. В технологии RAID выделяются несколько уровней, которые определяют физическую конфигурацию жестких дисков и логику записи данных на диски. Основные уровни – RAID 0 (чередование, обеспечивает макси- мальную производительность) и RAID 1 (зер- калирование, обеспечивает максимальную отказоустойчивость), все остальные уровни образуются за счет различных вариаций RAID 0 и 1. Так, например, RAID 10 (1+0) совме- щает в себе самое лучшее от первых двух, но для его создания необходимы минимум четыре диска, и при масштабировании системы хранения количество дисков всегда должно оставаться четным. Технология RAID используется не только в про- мышленных системах хранения данных, где, как правило, реализуется в специализирован- ном оборудовании на аппаратном уровне. Она также доступна в потребительском сегменте на домашних компьютерах. К примеру, опера- ционная система Microsoft Windows на про- граммном уровне поддерживает RAID 0, 1 и 5, начиная с Windows NT, а в процессорах Intel реализована технология Intel Rapid Storage Technology (Intel RST), которая может быть задействована современными BIOS для орга- низации дисков в RAID-массив в домашнем компьютере. Дмитрий Нефедов, Иван Котенок, QNAP Это тот самый вопрос, которым задаются перед тем, как "дозреть" до приобретения СХД. Ответ на него универсален для всех производителей СХД: использовать RAID-массив при построе- нии систем хранения, делать резервные копии или снапшоты системы, хранить информацию распределенно, в том числе и в облаке, чтобы не зависеть энергетически от конкретной элек- трической сети. Кирилл Сорокин, Infinidat Как правило, потенциальные сбои инфраструк- туры хранения рассматривают в разрезе двух параметров: Recovery Point Objective (допусти- мая потеря данных) и Recovery Time Objective (допустимое время восстановления данных). Допустимые значения этих параметров для бизнеса определяют выбор стратегии защиты данных. В целом защита и снижение рисков потери дан- ных состоят из нескольких ступеней: 1. Использование СХД максимальной надеж- ности. Логика простая: если основная система, на которой располагаются данные, будет мак- симально надежно работать, это уже значи- тельно сократит риски потери данных. Здесь стоит обращать внимание на аппаратную избыточность компонентов (контроллеров, дисков, сетевых интерфейсов и т.д.) и на так называемый показатель доступности СХД, измеряемый количеством девяток. Например, доступность СХД в пять девяток (99,999%) говорит о том, что в год допустим простой данных длительностью 365 х 24 х 60 х 60 х 0,001% = 315 с. Чем больше девяток, тем простой будет меньше. Аппаратную избыточ- ность тоже стоит оценивать вдумчиво. Не все- гда работает логика "чем больше, тем лучше". Например, одна СХД может обладать восемью Как снизить риск потери данных в случае выхода из строя частей системы?
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzk4NzYw