Эффективные подходы к проектированию архитектуры больших данных: ключевые принципы, современные технологии и примеры внедрения

Авторы

  • Анжелика Дмитриевна Крюкова Белгородский государственный национальный исследовательский университет
  • Ольга Викторовна Чернова Белгородский государственный национальный исследовательский университет

Ключевые слова:

архитектура больших данных, масштабируемость, обработка данных, Apache Hadoop, Apache Kafka, Apache Spark, потоковая аналитика, ETL-процесс, хранилище данных, облачные технологии, Лямбда-архитектура

Аннотация

Статья посвящена исследованию эффективных подходов к проектированию архитектуры больших данных, которые играют ключевую роль в обеспечении надежного хранения, обработки и анализа больших объемов информации. В работе рассматриваются основные принципы проектирования, включая масштабируемость, отказоустойчивость и гибкость архитектуры. Также проведен обзор современных технологий, таких как Apache Hadoop, Apache Kafka, Apache Spark и облачные решения (AWS, Google Cloud, Microsoft Azure), которые являются основой для реализации архитектур больших данных. Особое внимание уделено практическим аспектам внедрения архитектуры на основе реальных кейсов, включая системы аналитики в реальном времени, обработку потоковых данных и создание платформ для машинного обучения. Приведены рекомендации по выбору технологий и стратегий в зависимости от задач и объема данных.

Биографии авторов

Анжелика Дмитриевна Крюкова, Белгородский государственный национальный исследовательский университет

магистрант 1-го года обучения, Белгородский государственный национальный исследовательский университет
E-mail: 1472578@bsuedu.ru

Ольга Викторовна Чернова, Белгородский государственный национальный исследовательский университет

кандидат физико-математических наук, доцент, доцент кафедры прикладной математики и компьютерного моделирования, Белгородский государственный национальный исследовательский университет
E-mail: Chernova_Olga@bsuedu.ru

Библиографические ссылки

Архитектурный паттерн для обработки больших данных: Lambda [Электронный ресурс]. – Режим доступа: https://habr.com/ru/companies/otus/articles/766672/ (дата обращения 07.01.2025).

Баранова С. Н. Проектирование архитектур систем работы с большими данными // Современные технологии в науке и образовании. – Рязань, 2021. – С. 154.

Варианты архитектуры для обработки больших данных [Электронный ресурс]. – Режим доступа: https://learn.microsoft.com/ru-ru/azure/architecture/databases/guide/big-data-architectures (дата обращения 07.01.2025).

Григорьев Ю. А., Ермаков О. Ю. Обработка запросов в системе с лямбда-архитектурой на уровне ускорения // Информатика и системы управления. – 2020. – № 2. – С. 3–16.

Клеменков П. А., Кузнецов С. Д. Большие данные: современные подходы к хранению и обработке // Труды ИСП РАН. – 2012. – 143–156 с.

Матвеева П. Р. Сравнение лямбда и традиционной архитектур // Форум молодых ученых. – 2018. – № 1(17). – С. 734–740.

Методы ситуационного анализа и графической визуализации потоков больших данных. – Пролетарский А.

В., Березкин Д. В., Гапанюк Ю. Е. // Вестник МГТУ им. Н.Э. Баумана. Серия «Приборостроение». – М., 2018. – № 2(119). – 98–123 с.

Новиков Б. А., Графеева Н. Г., Михайлова Е. Г. Big data: Новые задачи и современные подходы // КИО. – 2014. – № 4. – С. 10–18.

Осипов Д. Технологии проектирования баз данных. – Litres, 2022.

Понин Ф. Н. Методология проектирования и создания баз данных для современного программного обеспечения // Universum: технические науки. 2024. №1 (118). URL: https://cyberleninka.ru/article/n/metodologiyaproektirovaniya-i-sozdaniya-baz-dannyh-dlya-sovremennogo-programmnogo-obespecheniya (дата обращения: 07.01.2025).

Сокольников А. М. Сравнительный анализ подходов к разработке архитектуры и систем управления базами данных для высоконагруженных WEB-сервисов // Кибернетика и программирование. – 2014. – №. 4. – С. 1–13.

AWS vs Azure vs Google Cloud [Электронный ресурс]. - Режим доступа: https://cloudfresh.com/ru/cloud-blog/awsvs-azure-vs-google-cloud/ (дата обращения 07.01.2025).

Data Age 2025 [Электронный ресурс]. – Режим доступа: https://www.seagate.com/www-content/ourstory/trends/files/Seagate-WP-DataAge2025-March-2017.pdf (дата обращения 07.01.2025).

Gartner [Электронный ресурс]. – Режим доступа: https://www.gartner.com/en (дата обращения 07.01.2025).

Hadoop vs. Spark: What’s the difference? [Электронный ресурс]. – Режим доступа: https://www.ibm.com/think/insights/hadoop-vs-spark (дата обращения 07.01.2025).

Kafka vs. Spark vs. Hadoop [Электронный ресурс]. – Режим доступа: https://www.logicmonitor.com/blog/kafkavs-spark-vs-hadoop (дата обращения 07.01.2025).

Seagate Reports [Электронный ресурс]. – Режим доступа: https://www.seagate.com/ (дата обращения 07.01.2025).

Загрузки

Опубликован

22.10.2025

Выпуск

Раздел

Математика