Зразок роботи
Робота написана під наглядом та з врахуванням порад наукового керівника кандидата фізико-математичних наук.
Захищено на 92 бали (А) зі 100
Готовий безкоштовно вислати частину роботи індивідуально на пошту (з графіками, формулами, розрахунками), щоб можна було переконатися в якості роботи
т. 068 455-57-41
2. Статистичні методи вичення взаємозв’язку
2.1. Кореляційно - дисперсійний аналіз
Кореляційний аналіз
Одним з найбільш загальних законів об'єктивного світу є закон зв'язку і залежності між явищами суспільного життя. Усі явища суспільного життя існують не ізольовано, вони органічно зв'язані між собою, залежать одні від одних, обумовлюють одні одних і знаходяться в постійному русі і розвитку. Розкриваючи взаємозв'язки і взаємозалежності між явищами можна пізнати їх суть і закони розвитку. Тому вивчення взаємозв'язків є основним завданням всякого статистичного аналізу. [6 ст.196]
Особливу актуальність має вивчення взаємозв'язку в умовах ринкової економіки і являє собою важливу функцію діяльності менеджерів і економістів. Вивчення механізму ринкових зв'язків, взаємодії попиту і пропозиції, вплив обсягу і складу пропозиції товарів на обсяг і структуру товарообороту, формування товарних запасів, прибутку та інших якісних показників має першорядне значення для прогнозування кон'юнктури ринку та рішення багатьох питань успішного ведення бізнесу. [7 ст.162]
Визначальна мета вимірювання взаємозв'язків — виявити і дати кількісну характеристику причинних зв'язків. Суть причинного зв'язку полягає в тому, що за певних умов одне явище спричинює інше. Причина сама по собі не визначає наслідку, останній залежить також від умов, в яких діє причина.
Вивчаючи закономірність взаємозв’язку, причини та умови об’єднують в одне поняття “фактор”. Відповідно ознаки, які характеризують фактори, називаються факторними (х), а ті, що характеризують наслідки, — результативними (у). [8 ст.100]
Між ознаками х та у існують різні за природою та характером види зв'язку: функціональні та стохастичні. [7 ст.162-164] Функціональні зв’язки характеризуються повною відповідністю між причиною і наслідком, тобто між факторною і результативною ознаками. Це означає, що при функціональному зв’язку кожному значенню х можна поставити у відповідність чітко визначене значення у. Такий зв’язок можна записати так:
Стохастичні зв’язки виявляються як узгодженість варіації двох чи більше ознак. Для них характерне те, що кажному значенню ознаки х відповідає певна множина значень результативної ознаки у: [9 ст.129-130]
Підвидом стохастичного зв'язку є кореляційна залежність, що зумовлює кореляційний зв'язок між ознаками. При такій залежності зі зміною факторної ознаки х змінюються групові середні результативної ознаки у і замість умовних розподілів множин значень ознаки у виступають середні значення цих розподілів. Таким чином, між ознаками х та у існує кореляційна залежність, коли середня величина однієї з них змінюється в залежності від значення іншої.
Кореляційний зв'язок між ознаками х та у записується у вигляді рівняння кореляційного зв'язку, або рівняння регресії: Y=f(х), де f(х) - певний вид функції кореляційного зв'язку, який описує лінію регресії. Визначення кореляційного зв'язку між ознаками Y=f(х) займає значне місце в дослідженнях соціально-економічних явищ в економіці і управлінні. Зміст такого зв'язку складає теорія кореляції. В основі теорії кореляції лежить кореляційно-регресійний аналіз (КРА), суть якого полягає у виборі виду рівняння регресії Y=f(х), обчисленні його парамегрів та встановленні адекватності (відповідності) теоретичної залежності фактичним даним. [7 ст.163-164]
За напрямком розрізняють зв'язки прямі і обернені. Прямий зв 'язок - це такий зв'язок, коли із зростанням факторної ознаки, результативна ознака також зростає. При оберненому зв'язку із збільшенням факторної ознаки результативна зменшується або, навпаки, із зменшенням факторної ознаки, результативна зростає.
За своїм аналітичним виразом (за формою) зв'язок ділиться на прямолінійний і криволінійний. При прямолінійній кореляційній залежності рівним змінам середніх значень факторної ознаки відповідають приблизно рівні зміни середніх значень результативної ознаки. При криволінійній кореляційній залежності рівним змінам середніх значень факторної ознаки відповідають нерівні зміни середніх значень результативної ознаки. [6 ст.197]
Під формою кореляційного зв'язку розуміють тип аналітичного рівняння, що виражає залежність між досліджуваними ознаками. Встановлення форми зв'язку між ознаками в більшості випадків обґрунтовується теорією або практичним досвідом попередніх досліджень. Якщо форма зв'язку невідома, то при парній кореляції математичне рівняння може бути встановлено за допомогою складання кореляційних таблиць, побудови статистичних групувань, перегляду різних функцій на ЕОМ і вибору такого рівняння, яке дає найменшу суму квадратів відхилень фактичних даних від вирівняних (теоретичних) значень та ін.
Особливе місце в обґрунтуванні форми зв'язку при проведенні кореляційного аналізу належить графікам, побудованим у системі прямокутних координат на основі емпіричних даних. Графічне зображення фактичних даних дає наочне уявлення про наявність і форму зв'язку між досліджуваними ознаками. За допомогою графіка добирають відповідне математичне рівняння для кількісної оцінки зв'язку між результативною і факторною ознаками. Рівняння, що відображає зв'язок між ознаками, називають рівнянням регресії або кореляційним рівнянням. Якщо рівняння регресії зв'язує лише дві ознаки, то воно називається рівнянням парної регресії. [10 ст.175-176]
Важливою характеристикою кореляційного зв'язку є лінія регресії — емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу. Емпірична лінія регресії представлена груповими середніми результативної ознаки , кожна з яких належить до відповідного інтервалу значень групувального фактора . Теоретична лінія регресії описується певною функцією , яку називають рівнянням регресії, а Y — теоретичним рівнем результативної ознаки. [8 ст.103]
В регресійному аналізі розрізняють рівняння парної (простої) та множинної (багатофакторної) регресії. Коли зв'язок із результативною ознакою у здійснюється з одним видом факторної ознаки х, то рівняння регресії має назву рівняння парної регресії. [7 ст.165]
В практиці економіко-статистичних досліджень часто доводиться мати справу з прямолінійною формою зв'язку, яка виражається за допомогою рівняння регресії (рис. 2.1).
На графіку (рис. 2.1) середню арифметичну результативної ознаки відображає пряма, паралельна осі абсцис, лінійне кореляційне рівняння у(х) зображується похилою прямою, а кут нахилу між ними характеризує тісноту зв'язку. [6 ст.211-212]
Для виявлення кореляційного зв’язку між ознаками використовується ряд спеціальних методів, серед яких: дисперсійний аналіз та елементарні прийоми (паралельне порівняння рядів значень результативної та факторної ознаки; графічне зображення фактичних даних за допомогою поля кореляції; побудова групової та кореляційних таблиць) та інші методи.[9 ст.132]
При кореляційному зв'язку разом із досліджуваним фактором на результативну ознаку впливають й інші фактори, які не враховуються або не можуть бути точно враховані. При цьому дія їх може бути спрямована як у бік підвищення результативної ознаки, так і в бік її зниження. Отже, дослідження зв'язку відбувається в умовах, коли цей зв'язок більшою або меншою мірою затушовується суперечливою дією інших причин. Тому одне із завдань кореляційного аналізу полягає у визначенні тісноти зв'язку між ознаками, у визначенні сили дії досліджуваного фактора на результативну ознаку. [10 ст. 181]
Серед характеристик, за допомогою яких оцінюють тісноту зв'язку між ознаками виділяють: коефіцієнт детермінації та коефіцієнт кореляції. [7 ст.169]
Для вимірювання тісноти зв'язку і визначення його напрямку при лінійній залежності використовують лінійний коефіцієнт кореляції, який визначається за формулою:
[6 ст.218]
де
Він може бути обчислений за іншими формулами:
;
[10 ст. 181]
Найбільш зручною формулою для розрахунку коефіцієнта кореляції за незгрупованими даними є наступна:
[11 ст.265]
Значення r лежить у діапазоні -1<r<+1. При r=0 ознаки не можуть мати лінійного кореляційного зв'язку. Ступінь тісноти їх лінійної залежності зростає при наближенні до ±1. Коли r >0, то зв'язок між ознаками прямий (при зростанні х зростає Y), при r <0 - обернений (при зростанні х зменшується Y). [12 ст.159]
Для встановлення достовірності лінійного коефіцієнта кореляції використовують критерій Стьюдента (t-критерій ): ,
де - середня похибка коефіцієнта кореляції, яку визначають за формулою:
При достатньо великому числі спостережень коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою похибку в три і більше разів, а якщо він менший ніж три, то зв’язок між досліджуваними ознаками х та у не доведено. [13 ст.163]
Квадрат коефіцієнта кореляції називається коефіцієнтом детермінації ( ). Він показує, яка частка загальної варіації результативної ознаки визначається досліджуваним фактором. Якщо коефіцієнт детермінації виражений у процентах, то його слід читати так: варіація (коливання) залежної змінної на стільки-то процентів зумовлена варіацією фактора.[10 ст. 181]
........................................................................................................................
Дисперсійний аналіз
Особливе місце у статистичному аналізі соціально-економічних явищ посідає дисперсія. На відміну від інших характеристик варіації завдяки своїм математичним властивостям вона є невіддільним і важливим елементом інших статистичних методів, зокрема дисперсійного аналізу. [8 ст.74]
Дисперсійний аналіз - це метод статистичної оцінки надійності проявлення залежності результативної ознаки від одного або кількох факторів. За допомогою методу дисперсійного аналізу проводиться перевірка статистичних гіпотез відносно середніх у кількох генеральних сукупностях, які мають нормальний розподіл. Дисперсійний аналіз є одним з основних методів статистичної оцінки результатів експерименту. Все більш широкого застосування набуває він і в аналізі економічної інформації. [10 ст.154]
Основною метою дисперсійного аналізу є виявлення впливу окремих факторів чи умов, які визначають варіацію ознаки. В основі дисперсійного аналізу лежить закон розкладання загальної дисперсії на складові, згідно з яким загальна дисперсія результативної ознаки у складається з двох частин: міжгрупової (факторної) дисперсії та середньої з групових (залишкової). [11 ст.253-254]
Відхилення індивідуального значення ознаки у від середньої ( ) можна розкласти на дві складові. У регресійному аналізі це відхилення від лінії регресії ( ) та відхилення лінії регресії від середньої ( ).
Відхилення ( ) є наслідком дії фактора х, відхилення ( ) — наслідком дії інших факторів. Взаємозв'язок факторної та залишкової варіацій описується правилом декомпозиції варіації:
де - загальна дисперсія; - залишкова дисперсія; - факторна дисперсія. [8 ст.159]
Факторну дисперсію з теоретичних значень обчислюють за формулою:
або за формулою без теоретичних значень
де a і b – параметри рівняння прямої лінії.
Залишкову дисперсію визначають або за формулою , або за правилом складання дисперсій .
Загальна дисперсія має вигляд: .[6 ст. 216-217]
Значення факторної дисперсії , буде тим більшим, чим сильніший вплив фактора х на у. Відношення факторної дисперсії до загальної розглядається як міра щільності кореляційного зв'язку і називається коефіцієнтом детермінації:
Різниця між загальною і залишковою дисперсіями дає нам теоретичну (факторну) дисперсію, яка вимірює варіацію, зумовлену фактором х. На порівнянні цієї різниці із загальною дисперсією побудований індекс кореляції, або теоретичне кореляційне відношення, яке визначається за такими формулами:
, або .
Індекс кореляції показує тісну залежність результативної ознаки від факторної. Він приймає значення від 0 до 1. Коли R = 0, то зв’язку між варіацією ознак х та у немає. [13 ст. 160]
Залишкова дисперсія дорівнює загальній ( ), а теоретична дисперсія дорівнює нулю ( =0). Всі теоретичні значення збігаються з середніми значеннями , лінія на графіку співпадає з лінією , тобто приймає горизонтальне положення.
При R = 1 теоретична дисперсія дорівнює загальній ( ), а залишкова ( ) = 0. Фактичні значення у збігаються з теоретичними , зв'язок між досліджуваними ознаками лінійно-функціональний.
Індекс кореляції придатний для вимірювання тісноти зв'язку при любій її формі. Він вимірює лише тісноту зв'язку і не показує її напрямок.[6 ст.217-218]
........................................................................................................................
2.2. Проста регресійна модель
Рівняння регресії характеризує зміну середнього рівня результативної ознаки (у) в залежності від зміни факторної ознаки (х). Воно визначає математичне сподівання групових середніх результативної ознаки під впливом різних значень факторної ознаки. [6 ст.212]
В економічних дослідженнях взаємозв'язку двох факторів серед множини функцій часто розглядається прямолінійна форма зв'язку, яка виражається рівнянням прямої лінії ,
де вирівняне значення результативної ознаки (залежна змінна); х - значення факторної ознаки (незалежна змінна); а - початок відліку, або значення при b = = 0 (економічного змісту не має); b - коефіцієнт регресії, який показує середню змінну залежної змінної при зміні незалежної змінної на одиницю (одне своє значення).
Коефіцієнти регресії є величинами іменованими, вони мають одиниці вимірювання, що відповідають змінним, між якими вони характеризують зв'язок.
Якщо b > 0, то зв'язок прямий, якщо b < 0, то зв'язок обернений, якщо b = 0, то зв'язок відсутній. [10 ст. 177]
Параметри (j=1-m) в рівняннях регресії визначаються методом найменших квадратів, який запропоновано в XVIII ст. французьким математиком Лежандром. Цей метод найкращим чином відповідає кореляційній таблиці і припускає знаходження таких значень параметрів рівняння регресії, при яких сума квадратів відхилень табличних (фактичних) значень результативної ознаки у від теоретичних за лінією регресії була б мінімальною:
Функція S параметрів рівняння регресії , буде мінімальною тоді, коли виконуються необхідні умови знаходження екстремуму цієї функції - дорівнення нулю перших похідних функції за параметрами:
Із цих умов визначається система нормальних рівнянь для знаходження параметрів a та b. [7 ст.166]
Існує порядок одержання системи нормальних рівнянь. Для одержання першого рівняння системи необхідно всі члени вихідного рівняння кореляційного зв'язку помножити на коефіцієнти при першому невідомому (а) й одержані добутки підсумувати. Потім для отримання другого рівняння необхідно всі члени вихідного рівняння помножити на коефіцієнт при другому невідомому (b) і також всі добутки підсумувати. [6 ст.213]
Техніка одержання системи нормальних рівнянь залишається аналогічною і для побудови системи рівнянь із більшим числом змінних. Так, для парного лінійного зв'язку система нормальних рівнянь має вигляд:
Параметри a і b рівняння прямої лінії можна визначити за іншими робочими формулами:
; [13 ст.156-157]
Де - сума значень факторної ознаки; - сума квадратів значень факторної ознаки; - сума значень результативної ознаки; - сума добутків значень факторної ознаки на значення результативної ознаки; [6 ст.213]
або
; [10 ст. 178]
де - середня із добутку факторної ознаки на результативну; - середня із суми факторної ознаки, піднесена до квадрату; - квадрат середньої із факторної ознаки. [7 ст.166]
Між коефіцієнтом повної регресії (b) і лінійним коефіцієнтом кореляції (r) існує такий зв'язок:
Отже, знаючи коефіцієнт кореляції (r) і значення середніх квадратичних відхилень по x та y, можна визначити коефіцієнт регресії (b), і навпаки, знаючи коефіцієнт регресії (b) і відповідні середні квадратичні відхилення, можна обчислити коефіцієнт кореляції (r). При парній лінійній залежності коефіцієнт кореляції та коефіцієнт повної регресії мають однакові знаки (плюс, мінус).[8 ст.109]
Між двома досліджуваними явищами часто використовують розраховані за рівняннями регресії коефіцієнти еластичності. Коефіцієнт еластичності показує, на скільки процентів зміниться в середньому результативна ознака y при зміненні факторної ознаки х на 1%. Відповідно до лінійної залежності коефіцієнт еластичності визначається за формулою
, де - коефіцієнт еластичності; - середнє значення факторної ознаки; - середнє значення результативної ознаки; b - коефіцієнт регресії.[13 ст.158]
Рівняння кореляційного зв’язку мають як пізнавальне, так і практичне значення, їх використовують для обчислення теоретичної лінії регресії, очікуваних (теоретичних, вирівняних) і прогнозованих значень залежної змінної при тих або інших значеннях фактора (факторів). При цьому слід мати на увазі, що рівняння дає середнє співвідношення між результативною і факторною ознаками, тому найбільшу точність збігання мають розрахункові значення результативної ознаки при величині фактора, близького до середнього його рівня.
Ступінь наближення розрахункових значень результативної ознаки до її фактичного значення залежить від того, наскільки досконала дана модель. Якщо вона включає всі основні фактори, що визначають варіацію результативної ознаки, то точність буде досить високою. [10 ст. 178]