ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ В ЗАДАЧАХ ДОСЛІДЖЕННЯ ІНФОРМАЦІЙНОСТІ СТАТИСТИЧНОГО КРИТЕРІЮ ДАРЛІНГА ПРИ ОЦІНЦІ ЙОГО ЕМПІРИЧНОЇ ФУНКЦІЇ
18.01.2024 16:08
[1. Information systems and technologies]
Author: Теплов Ігор Миколайович, магістрант, Дніпровський національний університет імені Олеся Гончара; Клименко Світлана Володимірівна, кандидат технічних наук, доцент, Дніпровський національний університет імені Олеся Гончара, м. Дніпро
Вступ./ Introductions.
Сучасний світ неможливо уявити як щось однорідне, стале та фундаментальне, оскільки він постійно знаходиться в безупинному потоці інформації. Через цей потік ми постійно стоїмо на порозі нового: ми отримуємо знання про різні явища, природу яких навіть не могли уявити в минулому, ми переосмислюємо свої уявлення про світ, формуючи більш об’єктивну точку зору про його природу, ми реалізуємо здобуті знання у вигляді інформаційних технологій та сучасних технічних рішень, і це лише дрібна частка тих змін, що постійно формують наше сьогодення та майбутнє. І якщо ми хочемо працювати з цими інформативними цінностями ми маємо дивитись на інформацію через призму статистики.
Статистичний підхід до вирішення різних проблем в обробці даних – це стрімкий потік, що йде паралельно інформаційному, через що він здатен інформаційний потік досліджувати, статистичні методи це інструменти взаємодії з даними, і ці інструменти надають широкий спектр можливостей, від простого виявлення цінних даних з великих баз даних, до надання розуміння тенденцій змін цих даних, що дозволить з певною ступінню точності прогнозувати різні події.
Ідея використання певних методів чи критеріїв для вирішення різних задач базується на розумінні різноманітності інформації, її достовірності та природі утворення, тому й виникла потреба в різних підходах. При цьому слід зазначити, що критерії також виконують роль стандартизації результатів статистичних досліджень, що грає ключову роль в відтворюваності результатів досліджень, формуванні гіпотез на основі статистичних закономірностей, за зведенню різних за суттю досліджень до стандартних вихідних даних.
Мета роботи./ Aim.
Метою цієї роботи є дослідження критерію Дарлінга, кінцевою ціллю є визначення його актуальності, насамперед в дослідженні точності експериментальних досліджень та вимірювань, а також виявлення його особливостей при роботі з вибірками випадкових величин.
Проблематикою роботи є роль критерію Дарлінга в реаліях сучасного світу, насамперед в завданнях дослідження вибірок випадкових величин. Крім того є необхідність визначити ролі з якими обраний критерій здатен впоратися в реаліях сучасного світу, в площині конкретних технічних задач.
Матеріали та методи./Materials and methods.
Якщо виділяти суть критерію Дарлінга то його можна описати як статистичний тест, мета якого виявити наявність викидів в вибірках випадкових величин. Якщо більш конкретно то критерій Дарлінга – це лакмусовий папір для вибірок випадкових величин, його роль полягає саме в індикації викидів, що робить зацікавленість ним в сучасних реаліях такою високою. Викиди в різних вибірках це не рідкість, тому роль подібних критеріїв є визначною в прийнятті рішень, оскільки правильний аналіз як позитивних аспектів так і негативних є важливим в багатьох сферах буття, як основа прийняття рішень.
Однак ми маємо бути об’єктивними в оцінці критерію, тому слід визначити метод оцінки його інформативності, простим та дієвим методом є визначення емпіричної ймовірності. Механіка її роботи досить проста, ми визначаємо для певної кількості вибірок усі позитивні випадки використання критерію, та визначаємо відношення з кількістю вибірок, таким чином ми одержимо відсоток інформативності.
Важливо зауважити що вибірки на основі котрих буде визначатись інформативність н основі емпіричної ймовірності, є лише локальним використанням критерію в конкретних задачах, тому це надає нам розуміння доцільності критерію в конкретному випадку, особливість критерію полягає в спектрі його універсальності, ми ж розглянемо певні сегменти цього аспекту.
Методом дослідження програмних генераторів вибірок релеєвських величин як правило не вдається виявити високі значення інформативності, це не обов’язково є свідченням непрацездатності критерію, навпроти це підтвердження високої стабільності релеєвських вибірок, та відсутності в них значних відхилень та викидів. Сам критерій більш стабільно працює з експоненційним та нормальним розподілом, надаючи високі показники інформативності. Важливо зазначити що параметри генераторів випадкових величин здатні вплинути на точність досліджень.
Результати та обговорення./ Results and discussion.
Дослідження критерію на предмет інформаційності, реалізованої як його емпірична функція надають неоднозначні результати, оскільки для предметної оцінки емпіричної функції критерію, призначеного для виявлення викидів, дослідження законів розподілу не ліпший метод. Більш повну картину можна отримати при дослідженні вибірок, де штучно введені елементи, що можна ідентифікувати як викиди.
Дослідження певних стандартизованих вибірок не є сильною стороною критерія Дарлінга, його сутність полягає в іншому, в дослідженні складних чи складених вибірок, де більша ймовірність виявити викиди, саме тоді розкриється потенціал критерію Дарлінга
Висновки./Conclusions.
Тематика дослідження та оцінки інформаційності статистичних критеріїв на рівні їх емпіричної функції, це дуже важливий аспект виявлення доцільності критеріїв в сучасних реаліях, однак тенденція визначати інформативності кожного критерію таким чином не є зовсім коректною. Чудовим прикладом цього є критерій Дарлінга, специфіка його роботи це те що потребу специфічних досліджень, а не стандартизованих підходів.
Список використаних джерел:
1. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. – М.: ФИЗМАТЛИТ, 2006. – 816 с. – ISBN 5-9221-0707-0.
2. В.С. Єременко, Ю.В. Куц, В.М. Мокійчук, О.В. Самойліченко СТАТИСТИЧНИЙ АНАЛІЗ ДАНИХ ВИМІРЮВАНЬ. . – К.: НАУ, 2013.– 320 с