DOI: 10.17586/2226-1494-2020-20-1-66-73


УДК004.7

МЕТОДИКА ДИФФЕРЕНЦИРОВАННОГО НАРАЩИВАНИЯ ЕМКОСТИ СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ С МНОГОУРОВНЕВОЙ СТРУКТУРОЙ 

Татарникова Т.М., Пойманова Е.Д.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Татарникова Т.М., Пойманова Е.Д. Методика дифференцированного наращивания емкости системы хранения данных с многоуровневой структурой
// Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 1. № 1. С. 66–73. doi: 10.17586/2226-1494-2020-20-1-66-73


Аннотация
Предмет исследования. Предложена методика дифференцированного наращивания емкости хранилища данных, построенная на прогнозной модели временных рядов с оценкой объема поступающего на хранение трафика. Рассмотрено влияние структуры входящего потока данных на выбор модели прогноза. Используемые подходы. Система хранения данных формализована в виде матрицы, устанавливающей количество уровней хранения и количество носителей/томов на каждом уровне. Элементами матрицы являются метаданные файлов, которые хранятся на соответствующих носителях/томах многоуровневой системы хранения данных. Матрица визуализирует состояние хранилища данных в виде паттернов. Построение паттернов выполняется с помощью система- тических срезов значений матрицы. Периодический анализ паттернов состояния хранилища данных позволяет оценить время достижения предельного значения емкости носителя. Прогнозная модель, положенная в основу методики дифференцированного наращивания емкости хранилища данных, учитывает структуру входящего потока данных. При наличии самоподобной структуры поступающего на хранение трафика реализуется прогнозная модель авторегрессии и проинтегрированного скользящего среднего. Для трафика без самоподобной структуры реализуется общая линейная модель прогноза временного ряда при известных прошлых значениях. Модель прогноза применяется отдельно для каждого носителя/тома уровня хранения. Основные результаты. Приведены особенности структуры трафика, поступающего на хранение. Проверены свойства самоподобия на примере LTE-трафика, демонстрирующие наличие распределений с «тяжелыми хвостами». С помощью модели авторегрессии и проинтегрированного скользящего среднего получены результаты прогноза объема поступающе- го на хранение трафика. Приведены прогнозные и реальные значения объема трафика, а также величина ошибки прогноза. Разработана методика дифференцированного наращивания емкости системы хранения данных, уста- навливающая последовательность шагов анализа паттернов и структуры трафика, поступающего на хранение. Практическая значимость. Методика наращивания емкости хранилища данных учитывает многоуровневую организацию хранения и структуру поступающего потока данных, позволяет организовать дифференцированное наращивание емкости хранилища в соответствии с характеристиками файлов и обеспечением требований к времени гарантированного хранения.

Ключевые слова: многоуровневое хранение, система хранения данных, хранилище данных, структура трафика, паттерн состояния хранилища данных, модель прогноза, методика наращивания емкости хранилища

Список литературы
1. Проскуряков Н.Е., Ануфриева А.Ю. Анализ и перспективы со- временных систем хранения цифровых данных // Известия Тульского государственного университета. Технические науки. 2013. № 3. С. 368–377.
2. Information Storage and Management. 2nd ed. New Jersey: John Wiley & Sons Inc., 2016. 544 p.
3. Farley M. Building Storage Networks. 2nd ed. Osborne: McGraw- Hall, 2001. 576 p.
4. Леонов В. Google Docs, Windows Live и другие облачные техно- логии. М.: Эксмо-Пресс, 2012. 304 с.
5. Богатырев В.А., Богатырев С.В., Богатырев А.В. Надежность кластерных вычислительных систем с дублированными связями серверов и устройств хранения // Информационные технологии. 2013. № 2. С. 27–32.
6. Mesnier M., Ganger G., Riedel E. Object-based storage // IEEE Communications Magazine. 2003. V. 41. N 8. P. 84–90. doi: 10.1109/MCOM.2003.1222722
7. Carr N.G. The Big Switch: Our New Digital Destiny. WW Norton & Company, 2008. 258 p.
8. Бурмистров В.Д., Заковряшин Е.М. Создание хранилища данных для распределенной системы // Молодой ученый. 2016. № 12. С. 143–147.
9. Buyya R., Broberg J., Goscinski A.M. Cloud Computing: Principles and Paradigms. New Jersey: John Wiley & Sons Inc., 2011. 637 p.
10. Советов Б.Я., Татарникова Т.М., Пойманова Е.Д. Организа- ция многоуровневого хранения данных // Информационно- управляющие системы. 2019. № 2. С. 68–75. doi: 10.31799/1684-8853-2019-2-68-75
11. Kish L.B., Granqvist C.G. Does information have mass? // Proceedings of the IEEE. 2013. V. 101. N 9. P. 1895–1899. doi: 10.1109/JPROC.2013.2273720
12. Morville P., Callender J. Search Patterns: Design for Discovery. O’Reilly Publ., 2010. 192 p.
13. Stacey M., Salvatore J., Jorgensen A. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. New Jersey: John Wiley & Sons Inc., 2013. 432 p.
14. Poymanova E.D., Tatarnikova T.M. Models and methods for studying network traffic // 2018 Wave Electronics and its Application in Information and Telecommunication Systems, WECONF 2018. 2018.
P. 8604470. doi: 10.1109/WECONF.2018.8604470
 


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2020 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика