Архитектура и инженерия платформ обработки больших данных: современные паттерны и технологии

Авторы

  • Анжелика Дмитриевна Крюкова Белгородский государственный национальный исследовательский университет
  • Ольга Викторовна Чернова Белгородский государственный национальный исследовательский университет

Ключевые слова:

архитектура больших данных, инженерия платформ, обработка данных, масштабируемость, аналитика данных, потоковая обработка, пакетная обработка, Hadoop, Apache Spark, NoSQL базы данных, Apache Kafka, отказоустойчивость, безопасность данных, искусственный интеллект, машинное обучение, данные в реальном времени, облачные технологии, гибридные архитектуры, Data Lakes, Data Warehouses, ETL процессы

Аннотация

Статья посвящена анализу архитектуры и инженерии платформ обработки больших данных, с акцентом на современные паттерны и технологии, используемые для решения задач штабируемости, аналитики и безопасности. В условиях стремительного роста объемов данных, эффективная обработка и управление информацией становятся ключевыми аспектами для бизнеса и науки. Рассматриваются основные архитектурные подходы, такие как пакетная и потоковая обработка данных, а также гибридные решения, позволяющие решать задачи в реальном времени и с высокой нагрузкой. В статье детально изучены популярные технологии, включая Hadoop, Apache Spark, NoSQL базы данных, а также системы для потоковой обработки данных, такие как Apache Kafka и Flink. Особое внимание уделяется вопросам безопасности, отказоустойчивости и масштабируемости платформ. Статья также поднимает текущие тренды в области больших данных, включая использование искусственного интеллекта и машинного обучения для аналитики и обработки информации. Обсуждаются перспективы развития технологий и их влияние на будущее обработки больших данных.

Биографии авторов

Анжелика Дмитриевна Крюкова, Белгородский государственный национальный исследовательский университет

магистрант 1-го года обучения, Белгородский государственный национальный исследовательский университет
E-mail: 1472578@bsuedu.ru

Ольга Викторовна Чернова, Белгородский государственный национальный исследовательский университет

кандидат физико-математических наук, доцент, доцент кафедры прикладной математики и компьютерного моделирования, Белгородский государственный национальный исследовательский университет
E-mail: Chernova_Olga@bsuedu.ru

Библиографические ссылки

Алпатов А. Н. 2025. Современные архитектуры и унификация обработки больших данных. Интеллектуальный потенциал России, № 2: 3–16.

Архитектурный паттерн для обработки больших данных: Lambda [Электронный ресурс]. - Режим доступа: https://habr.com/ru/companies/otus/articles/766672/ (дата обращения 10.06.2025)

Исаченко Ю. В., Степанов В. А. 2024. Архитектура вычислений. Обработка больших объемов данных : методические рекомендации. Витебск. Витебский государственный университет имени П. М. Машерова, Каф. прикладного и системного программирования: 44 с.

Клеменков П.А., Кузнецов С.Д. 2012. Большие данные: современные подходы к хранению и обработке. Труды ИСП320 РАН: 143–156.

Матвеева П. Р. 2018. Сравнение лямбда и традиционной архитектур. Форум молодых ученых,№1 (17): 734–740.

Новиков Б.А., Графеева Н.Г. 2014. Big data: Новые задачи и современные подходы. КИО, №4: 10–18.

Осипов Д. 2022. Технологии проектирования баз данных. Litres, 2022.

Понин Ф.Н. 2024. Методология проектирования и создания баз данных для современного программного обеспечения. Universum: технические науки, №1 (118). URL: https://cyberleninka.ru/article/n/metodologiyaproektirovaniya-i-sozdaniya-baz-dannyh-dlya-sovremennogo-programmnogo-obespecheniya (дата обращения: 10.06.2025).

Пролетарский А. В., Березкин Д. В. 2018. Методы ситуационного анализа и графической визуализации потоков больших данных. Москва. Вестник МГТУ им. Н.Э. Баумана. Серия «Приборостроение», №2 (119): 98–123.

Радченко И.А., Николаев И.Н. 2018. Технологии и инфраструктура Big Data. Современные технологии в науке и образовании: 53 с.

Сокольников А. М. 2014. Сравнительный анализ подходов к разработке архитектуры и систем управления базами данных для высоконагруженных WEB-сервисов. Кибернетика и программирование, №. 4: 1–13.

AWSvs Azure vs Google Cloud [Электронный ресурс]. – Режим доступа: https://cloudfresh.com/ru/cloud-blog/awsvs-azure-vs-google-cloud/?utm_source=chatgpt.com (дата обращения 10.06.2025)

Data Age 2025 [Электронный ресурс]. – Режим доступа: https://www.seagate.com/www-content/ourstory/trends/files/Seagate-WP-DataAge2025-March-2017.pdf (дата обращения 10.06.2025)

Gartner [Электронный ресурс]. – Режим доступа: https://www.gartner.com/en (дата обращения 10.06.2025)

Hadoop vs. Spark: What’s the difference? [Электронный ресурс]. - Режим доступа: https://www.ibm.com/think/insights/hadoop-vs-spark?utm_source=chatgpt.com (дата обращения 10.06.2025)

Kafka vs. Spark vs. Hadoop [Электронный ресурс]. – Режим доступа: https://www.logicmonitor.com/blog/kafkavs-spark-vs-hadoop?utm_source=chatgpt.com (дата обращения 10.06.2025)

Seagate Reports [Электронный ресурс]. – Режим доступа: https://www.seagate.com/ (дата обращения 10.06.2025)

Загрузки

Опубликован

22.10.2025

Выпуск

Раздел

Математика