Мета– закріплення теоретичного й практичного матеріалу, придбання навичок роботи в модулі Basic Statistics/Tables.

Гавриленко В.О. ЭП 2 – 2

Лабораторна робота №1 «Попередній аналіз вихідних даних»

Мета– закріплення теоретичного й практичного матеріалу, придбання навичок роботи в модулі Basic Statistics/Tables.

Завдання -необхідно провести аналіз варіаційного ряду для вибіркових даних банків України в модулі Basic Statistics/TablesППП Statistica:

1. Розрахувати статистичні характеристики ряду (середнє, дисперсію, середнєквадратичне відхилення, моду, медіану, розмах, коефіцієнти асиметрії й ексцесу).

2. Побудувати гістограму й полігон розподілу випадкової величини, зробити висновки про характер закону розподілу.

3. За допомогою критеріїв Колмогорова - Смирнова і Пірсона перевірити гіпотезу про нормальний закон розподілу.

4. Зробити висновки щодо угруповання банків по величині відповідного показника.

Методичні рекомендації

Для рішення й аналізу задач даного типу в ППП Statistica передбачений модуль Basic Statistics/Tables(Основні статистики й таблиці). Розглянемо порядок роботи в даному модулі.

1. Запуск Statistica і підготовка даних. У меню програм вибрати програму Statistica, після її запуску виберіть у меню пункт File-New для підготовки власних даних. Перед Вами з'явиться діалогове вікно, у якому необхідно вказати кількість змінних (Number of variables) і кількість випадків (Number of Cases). Після уведення натисніть кнопку вікна OK (рис. 1)

Рис. 1.Завдання кількості змінних і спостережень

Перед Вами з'явиться порожнє поле, що представляє собою таблицю розміру 25*2: 25 спостережень, 2 змінні (рис. 2).

Рис. 2.Порожнє поле даних

Кожен елемент даних, тобто значення показника, займає одину комірку поля даних. Після заповнення всіх комірок поля даних Ви одержите таблицю, аналогічну представленої на рис. 3.

Рис. 3.Вихідні дані

2. Розрахунки.Щоб приступити до обчислювальних процедур необхідно ввійти в позицію меню Statistics / Basic Statistics/Tables. Після підтвердження вибору модуля перед Вами з'явиться діалогове вікно, що дозволяє задати напрямок аналізу Descriptive statistics (Описові статистики).

Після вибору напрямку аналізу з'явиться стартова панель модуля де необхідно задати вихідні параметри: Variable (Змінні), і відповідний набір процедур для подальшого аналізу (рис. 4).

Ініціюйте кнопку Variable (Змінні) і у вікні, що з'явилося, укажіть показники, по яких здійснюється аналіз. Після зазначення змінних підтвердьте свій вибір натисканням кнопки ОК. Далі ініціювавши вкладиш Advanced, необхідно виділити основні статистики для розрахунку (рис. 5).

Рис.4. Стартова панель модуля

Рис. 5. Вибір описових статистик

Такими є: Valid N (число спостережень), Mean (середнє), Sum (сума значень), Median (медіана), Mode (мода), Standard Deviation (среднеквадратичне відхилення), Variance (дисперсія), Skewness (коефіцієнт асиметрії), Kurtosis (коефіцієнт ексцесу), Min & Max (мінімум і максимум), Range (розмах вибірки). Результати розрахунку описових статистик для даної вибірки одержуємо натисканням клавіші Summary, і вони наведені на рис. 6.

Рис. 6. Описові статистики

Для наочності подання досліджуванї сукупності, побудуємо полігон розподілу. Для цього необхідно в меню Graphs / 2D Graphs / Line Plots (variables) вибрати змінну й побудувати лінійний графік значень (рис. 7).



Рис. 7. Полігон розподілу

Подальший аналіз здійснюється в рамках перевірки вибірки на нормальний закон розподілу. Для проведення угруповання вибірки в стартовій панелі модуля вибираємо вкладиш Normality, де задаємо кількість інтервалів і критерій Колмогорова – Смирнова для тестування вибірки. Ініціювавши клавішу Frequency tables (Таблиці частот) одержуємо наступну таблицю (рис. 8).

Рис. 8. Результат угруповання вибірки

Як видно, вихідна сукупність із 25 банків розбита на 7 інтервалів й у кожному інтервалі розраховані наступні характеристики: Count (частота), Cumulative Count (накопичена частота), Percent of Valid (% від загальної частоти), Cumul % of Valid (накопичений % від загальної частоти), % of all Cases (% від загального числа спостережень), Cumulative % of all Cases (накопичений % від загального числа спостережень), Expected Count (теоретична частота), Cumulative Expected (накопичена теоретична частота), % Expected (% від загальної теоретичної частоти), Cumulative % Expected (накопичений % від загальної теоретичної частоти).

Ініціювавши клавішу Histograms, одержимо наступну гістограму розподілу з накладеним нормальним законом розподілу й критерієм Колмогорова – Смирнова, значення якого порівнюється з табличним (рис. 9).

Рис. 9. Гістограма розподілу

Подальший аналіз вибірки припускає розрахунок критерієм Пірсона й формування відповідних висновків про характер закону розподілу. Для цього в головному меню Statistics вибираємо модуль Distribution Fitting (Закони розподілу). Далі вибираємо змінну для аналізу й нормальний закон розподілу, параметри для розрахунків й умови для критеріїв можна задати самостійно або за замовчуванням вони задані автоматично. Ініціювавши кнопку графіка одержуємо гістограму й значення відповідних критеріїв (рис. 10).

Рис. 10. Гістограма розподілу із критерієм Пірсона й Колмогорова - Смирнова

Далі робимо висновки про угруповання даних об'єктів по величині показника % доходу. Порівнюємо отримані значення з табличними за відповідними критеріями й робимо висновки про характер закону розподілу.


0392236123466271.html
0392288981032410.html
    PR.RU™