ОГЛЯД МОЖЛИВИХ СПОСОБІВ ПОБУДОВИ ІНФРАСТРУКТУРИ ОПРАЦЮВАННЯ ВЕЛИКИХ ДАНИХ У ПУБЛІЧНИХ ХМАРАХ З ВИКОРИСТАННЯМ МОДЕЛІ PAAS

01.09.2021 21:21

[1. Information systems and technologies]

Author: Голубовський М.П., магістрант, кафедра комп’ютерних систем та мереж, Тернопільський національний технічний університет імені Івана Пулюя, м. Тернопіль

До ключових особливостей, які характерні для побудови інфраструктур опрацювання великих даних можна віднести необхідність дешевого зберігання великих об’ємів різноманітної за структурою інформації та значні вимоги до обчислювальний ресурсів, для обробки цієї інформації. Такі системи також характеризуються потребою забезпечити масштабованість ресурсів, відповідно до вимог, що постійно ростуть у результаті зростання об’єму даних, появи нових запитів щодо технологій їх обробки, швидкодії роботи. У результаті така інфраструктура є дорогою, складною, вимагає значної кількісті кваліфікованих працівників для її підтримки.

Найпопулярнішим на даний час інструментом для вирішення проблем у сфері великих даних є проект Hadoop, до складу якого входять бібліотеки, фреймворки та утиліти з відкритою ліцензією для розробки, виконання і супроводу розподілених програм, адаптованих для опрацювання великих обсягів даних, та виконання на кластерах з великою кількістю вузлів.

Для оптимізації витрат щодо побудови та обслуговування інфраструктури опрацювання великих даних у порівнянні з використанням власних, локальних комп’ютерних ресурсів доцільно розглянути можливість її побудови із застосуванням підходу хмарних обчислень. Підхід передбачає оренду комп’ютерних ресурсів у постачальника хмарних послуг, доступ та конфігурація яких надається через мережу. У результаті користувач звільняється від необхідності здійснювати обслуговування апаратних ресурсів, та отримує майже необмежену масштабованість, використовуючи орендовані у постачальників ресурси. Лідерами на ринку надання публічних хмарних ресурсів є Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform (GCP).

Для реалізації функціоналу платформи Hadoop постачальники публічних хмарні сервіси пропонують рішення, доступні за моделлю PaaS (Platform as a service). Згідно неї користувач отримує доступ до функціоналу платформи, можливість встановлювати, розробляти і запускати прикладне програмне забезпечення, маючи можливість конфігурувати і змінювати кількість обчислювальних ресурсів кластера. Робота апаратних ресурсів, таких як сервери, сховища даних, дискові масиви, мережі повністю керується і обслуговується постачальником. Перевагою також є майже миттєва доступність новостворених ресурсів платформи, можливість реалізувати високу доступність та відмовостійкість рішення. До таких PaaS рішень, зокрема, відносяться продукти Amazon EMR, Azure HDInsight і Google Dataproc.

Продукт від Amazon – EMR дозволяє реалізувати середовище Hadoop, яке використовує обчислювальні ресурси Amazon EC2 (Elastic Compute Cloud) та сховище даних Amazon S3 (Simple Storage Service). Рішення підтримує можливість автоматичного припинення роботи кластера після виконання обчислювальних завдань, що дозволяє не платити за ресурси, які вже не використовуються. Інфраструктура EMR легко масштабована, кількість ресурсів можна автоматично збільшувати та зменшувати у залежності від навантаження. EMR розділяє ресурси обчислення та зберігання даних, що дає можливість масштабувати кожен з елементів. EMR дозволяє використовувати вбудовані засоби моніторингу ресурсів та логування. Платформа підтримує функціонал автоматичної заміни обчислювальних машин, що погано працюють та відновлення при втраті вузлів кластера. Постачальник послуг також забезпечує оновлення програмних компонентів до останніх стабільних версій. Є можливість використовувати користувацькі образи операційної системи, встановлювати додаткове програмне забезпечення на етапі ініціалізації кластера. Функціонал Amazon EMR базується на використанні продуктів Apache з відкритим кодом: Spark, Hive, HBase, Flink, Hudi та Presto.

Google Dataproc – платформа, що надається Google Cloud Platform і дозволяє запускати Apache Spark та Hadoop кластери у хмарні інфраструктурі. Google Dataproc інтегрується з іншими сервісами Google Cloud Platform, що дозволяє використовувати сервіси моніторингу Cloud Monitoring, логування Cloud Logging, масштабовану NoSQL базу даних Cloud Bigtable, хмарне сховище для даних Cloud Storage, сервіс для інтерактивного широкомасштабного аналізу великих наборів даних BigQuery. До складу Google Dataproc входять наступні компоненти платформи Apache Hadoop: Spark, Hive, Pig, Tez, Druid, HBaze, Hive WebHCat, Jupyter Notebook, Kerberos, Presto, Zookeeper, мови програмування Python і Scala. При створенні кластера є можливість додати додаткові програмні продукти. Рішення підтримує роботу з контейнерами, що дозволяє одного разу розробивши свою програму запускати її у різних середовищах. Продукт підтримує багато можливостей щодо реалізації безпеки, дозволяє використовувати протокол Kerberos, усі дані з якими працює платформа автоматично шифруються. Особливість платформи є можливість реалізовувати кластер з використанням preemptible віртуальних машин, що дозволяють економити до 80% витрат на обчислювальні ресурси.

Azure HDInsight – хмарна служба Microsoft з відкритим кодом для роботи з великими даними. HDInsight дозволяє розробляти за запускати рішення з використання технологій Apache Hadoop, Hive, Spark, LLAP, Kafka, HBase, Storm. Служба гарантує високу доступність (99.9 percent SLA), підтримує моніторинг здоров’я кластера та автоматичне відновлення при відмовах. Продукт Microsoft реалізує можливості безпечної роботи з даними, забезпечуючи їх шифрування, можливість налаштування гнучких політик доступу з використанням Apache Ranger, інтеграцію з Active Directory. Сервіс доступний у найбільшій кількості регіонів, порівнюючи з іншими рішеннями. Підтримується можливість встановлення додаткових компонентів, автоматичне масштабування ресурсів у відповідності до навантаження. HDInsight підходить для реалізації різноманітних рішень, зокрема, пакетної обробки даних, зберігання великих об’ємів даних та виконання аналітики по них, збирання та обробки інформації з різноманітних пристрої у реальному часі (IoT), машинного навчання та гібридних рішень.

Література:

1. Big Data What it is and why it matters [Електронний ресурс] // SAS – Режим доступу до ресурсу: https://www.sas.com/en_us/insights/big-data/what-is-big-data.html.

2. Min Chen, Shiwen Mao, Yin Zhang, Victor C.M. Leung. Big Data. Related Technologies, Challenges, and Future Prospects. — Spinger, 2014. — 100 c.

3. Amazon EMR Documentation [Електронний ресурс] – Режим доступу до ресурсу: https://docs.aws.amazon.com/emr.

4. Google Dataproc documentation [Електронний ресурс] – Режим доступу до ресурсу: https://cloud.google.com/dataproc/docs.

5. What is Azure HDInsight? [Електронний ресурс] – Режим доступу до ресурсу: https://docs.microsoft.com/en-us/azure/hdinsight/hdinsight-overview.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

СУЧАСНІ ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ В ЗАБЕЗПЕЧЕННІ НАЦІОНАЛЬНОЇ БЕЗПЕКИ УКРАЇНИ
03.09.2021 21:48
КІБЕРСОЦІАЛІЗАЦІЯ ЯК ФАКТОР ІНФОРМАЦІЙНОЇ БЕЗПЕКИ ОСОБИСТОСТІ
03.09.2021 21:46
ВИКОРИСТАННЯ MLS MOODLE В НАВЧАЛЬНОМУ ПРОЦЕСІ
03.09.2021 21:45
ОПИС БІБЛІОТЕКИ JQUERY ДЛЯ ВЕБ-ПРОГРАМУВАННЯ
03.09.2021 21:40
ВЫБОР БАЗИСА ОПТОЭЛЕКТРОННЫХ ЛОГИЧЕСКИХ СХЕМ
03.09.2021 21:36

Сonferences

Conference 2026

Information society: technological, economic and technical aspects of formation (issue 106) (15-16.01.2026)

Information society: technological, economic and technical aspects of formation (issue 107) (10-11.02.2026)

Information society: technological, economic and technical aspects of formation (issue 108) (5-6.03.2026)

Information society: technological, economic and technical aspects of formation (issue 109) (8-9.04.2026)

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Information society: technological, economic and technical aspects of formation (issue 102) (16-17.09.2025)

Information society: technological, economic and technical aspects of formation (issue 103) (14-15.10.2025)

Information society: technological, economic and technical aspects of formation (issue 104) (13-14.11.2025)

Information society: technological, economic and technical aspects of formation (issue 105) (11-12.12.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

ОГЛЯД МОЖЛИВИХ СПОСОБІВ ПОБУДОВИ ІНФРАСТРУКТУРИ ОПРАЦЮВАННЯ ВЕЛИКИХ ДАНИХ У ПУБЛІЧНИХ ХМАРАХ З ВИКОРИСТАННЯМ МОДЕЛІ PAAS

Another articles in this section