Ekonometriamodel ekonometryczny cz.3

Praca jest zabezpieczona przed kopiowaniem – wprowadzono wiele błędów obliczeniowych aby uniemożliwić łamanie praw autorskich.

 

 

 

1.Homoscedastyczność – stałość wariancji:

 

Stawiamy hipotezę:

                                   H0:   s12 = s22  (są równe w obu grupach)

przeciwko              H1:   s12 <> s22  (nie są równe).

 

Na wykresie przedstawiam kwadraty reszt otrzymane po zastosowaniu MNK:

 

 

Próbę n = 15 dzielimy na dwie podgrupy (n1 i n2). Z wykresu wynika, że wariancje w tych podgrupach mogą być różne. Wariancje przyjmują szczególnie dużą wartość dla trzech spośród dwunastu pierwszych okresów. Dlatego też decyduję się przyjąć n1=12 oraz n2=3. Stosując MNK szacuję wektory parametrów dla pierwszych dwunastu okresów oraz dla trzech ostatnich okresów. Wszystkie obliczenia dokonuję w programie Microsoft Excel funkcją „Regresja”.

 

Hipotezę weryfikujemy wykorzystując następującą statystykę:

Statystyka

 

 

gdzie:

 - wariancja reszt modelu regresji dla podgrupy o większej wariancji;

 - wariancja reszt modelu regresji dla podgrupy o mniejszej wariancji.

 

·        Dla n1 otrzymałem:

 

Statystyki regresji

Wielokrotność R

0,830407271

R kwadrat

0,689576236

Dopasowany R kwadrat

0,658533859

Błąd standardowy

1180,70637

Obserwacje

12

 

 

 

Współczynniki

Błąd standardowy

t Stat

Wartość-p

Dolne 95%

Górne 95%

Przecięcie

70,50854977

759,403281

0,092847

0,927859

-1621,55

1762,565

X1

4,229810161

0,897443701

4,713176

0,000825

2,230181

6,22944

Więc: y=4,2298x + 70,509

 

 

·        Dla n2 otrzymałem:

 

Statystyki regresji

Wielokrotność R

0,96968481

R kwadrat

0,940288631

Dopasowany R kwadrat

0,880577261

Błąd standardowy

540,2380107

Obserwacje

3

 

 

Współczynniki

Błąd standardowy

t Stat

Wartość-p

Dolne 95%

Górne 95%

Przecięcie

-522,5631615

798,1671525

-0,654703917

0,630967

-10664,2

9619,069

X1

4,689806694

1,181824163

3,96827789

0,157155

-10,3266

19,70624

 

Więc: y=4,6898x + 522,56

 

 

Na podstawie tych równań wyznaczyłem reszty:

 

Obserwacja

ei

ei2

 

Obserwacja

ei

ei2

1

2191,054712

4800720,749

 

13

-365,727

133756,2

2

-637,4380021

406327,2066

 

14

396,4317

157158,1

3

-912,5737642

832790,8752

 

15

-30,7047

942,7781

4

220,6993511

48708,20356

 

SUMA

 

291857,1

5

-836,9802297

700535,9049

 

 

 

 

6

-516,5002911

266772,5507

 

 

 

 

7

-1282,399113

1644547,484

 

 

 

 

8

-202,2949538

40923,24832

 

 

 

 

9

-472,0935689

222872,3378

 

 

 

 

10

-272,6632452

74345,24529

 

 

 

 

11

586,0958616

343508,3589

 

 

 

 

12

2135,093243

4558623,158

 

 

 

 

SUMA

 

13940675,32

 

 

 

 

 

Obliczam Se2:

 

S12 = 1394067,532 oraz S22 = 291857,1083

 

Podstawiając do wzoru na F otrzymuję:

 

Fobl = 0,209356506

 

Dla n1 – m – 1 =10 (w liczniku) i n2 – m – 1 = 1 (w mianowniku) oraz dla poziomu istotności a = 0,05 wartość krytyczna F* wynosi:

 

F* = 242

 

Ponieważ Fobl < F* = 242, zatem nie ma podstaw do odrzucenia hipotezy zerowej na poziomie istotności =0,05, co oznacza, że wariancja mojego modelu jest stała.

 

 

1.                              Analiza wpływów:

 

W danych wykorzystywanych do budowy modelu ekonometrycznego często występują obserwacje odróżniające się pewnymi cechami od pozostałych. Wyróżnia się dwa rodzaje takich obserwacji: nietypowe i wpływowe. Kryterium wyróżniającym te obserwacje są skutki ich oddziaływania na model ekonometryczny.

 

Obserwacja nietypowa charakteryzuje się dużą resztą, czyli różnicą między wartością rzeczywistą zmiennej objaśniającej a wartością teoretyczną tej zmiennej wynikającą z modelu ekonometrycznego.

 

Obserwację uważa się za wpływową, jeśli w wyniku nieznacznej zmiany jej wartości (przesuwania jej) lub usunięcia z danych znacznie zmieniają się oszacowane parametry modelu. Wartości reszt obserwacji wpływowych nie są duże.

 

Poniższa tabela przedstawia wartości bezwzględne reszt I ei I oraz wartości zmiennej objaśniającej X1 i zmiennej objaśnianej Y.

 

L.p.

I ei I

Y

X1

1

2239,6

5899,2

860

2

566,7

2119,0

635

3

849,3

2161,1

710

4

323,9

1581,3

305

5

801,4

3429,5

992

6

475,7

3525,8

939

7

1309,7

5682,7

1630

8

102,1

1285,2

335

9

393,3

1937,5

553

10

173,3

1252,9

344

11

665,2

2983,0

550

12

2148,1

7370,2

1221

13

676,3

1048,6

413

14

102,2

2021,8

458

15

131,2

4108,4

994

Za obserwacje nietypowe uznałem obserwację 1, 7 i 12. Teraz badam jak zmieni się model po usunięciu każdej ze zmiennych. Zmiany w parametrach modelu są pokazane w równaniu obok wykresu wraz ze współczynnikiem determinacji R2.

 

Po usunięciu pierwszej obserwacji współczynnik determinacji wzrósł z 0,7195 do 0,7903 i dopasowanie modelu się poprawiło.

 

 

 

 

Po usunięciu obserwacji 7 z danych model nieznacznie się zmienił a dopasowanie modelu minimalnie się poprawiło.

 

Ekonometria i statystyka

 

 

 

 

 

 

 

 

Usuwając obserwację 12 z danych dopasowanie modelu zmienia się w najmniejszym stopniu w porównaniu z poprzednimi obserwacjami.

 

 

 

Przedstawione obserwacje są obserwacjami wpływowymi w modelu ekonometrycznym, oraz są obserwacjami nietypowymi ze względu na każdą ze zmiennych oddzielnie występujących w modelu (znacznie odbiegające reszty od pozostałych). Dobrze pokazuje to poniższy wykres, na którym zostały usunięte obserwacje 1, 7 i 12. Widzimy, że linia trendu nie zmieniła swojego kierunku w jakiś znaczący sposób, ale oszacowane parametry modelu zmieniają się znacznie.

 

 

Ekonometria i statystyka

 

 

Po usunięciu wszystkich nietypowych obserwacji dopasowanie modelu jest największe

( R2 = 0,8258 ).

 

 

 

 

 

 

 

II.                Predykcja na podstawie modelu (prognoza i jej ocena):

 

Prognozowanie ilości wywiezionych odpadów komunalnych stałych w województwie zachodnio – pomorskim można przeprowadzić podstawiając do skonstruowanego modelu rzeczywistej wartości zmiennej objaśniającej:

 

Dane dla województwa zachodnio – pomorskiego:

 

Y =  3413,5

X1 = 511

 

Model ekonometryczny ma postać:

 

Y = 4,3283X1 - 62,7102

 

Podstawiając do modelu rzeczywistą wartość X1 otrzymujemy:

Y = 4,3283*511 - 62,7102 = 2149,051

 

 

Błąd predykcji:

      Ekonometria i statystyka

 

     

gdzie:

Yp – prognozowana wartość Y w woj. zachodnio – pomorskim  

Yr – rzeczywista wartość Y w woj. zachodnio – pomorskim

 

d = ½2149,051 - 3413,5½= 1264,4

 

Błąd względny predykcji:

 

V = (d / Yr) * 100%

 

V = (1264,4/ 3413,5) * 100% = 37,04%

 

 

 

 

 

III.             Wnioski:

 

  1. Uzyskany wynik błędu względnego predykacji dyskwalifikuje sporządzony model, pod warunkiem, że występujące w badanym zjawisku masowym prawidłowości oszacowano na podstawie rozkładu cech starannie zgromadzonego materiału statystycznego.
  2. Ponieważ zaufanie do zgromadzonego materiału statystycznego obciążone jest poważnymi zastrzeżeniami – stąd wnioskowanie o niedopasowaniu sporządzonego modelu ekonometrycznego jest wysoce ryzykowne.

         Zastrzeżenia do zgromadzonych danych statystycznych wynikają z następujących faktów:

a)      Ścisłą ewidencję wytwarzanych odpadów wprowadzono w roku 2001, stąd dane statystyczne o ilościach odpadów, wywiezionych z miejsc ich wytwarzania, pochodzące z roku 2000, są jedynie przybliżone;

b)      Zastosowana miara ilości wywiezionych odpadów (m3) umożliwia dokonywanie ewidencji na podstawie ilości wywiezionych odpadów stałych, zgromadzonych w pojemnikach o standaryzowanej pojemności: 110 dcm3 (0,11m3), 1.100 dcm3 (1,1 m3), 7 m3, 10 m3. Ponieważ jednak stopień wypełnienia tych pojemników nie podlega kontroli, stąd dokonywana ewidencja jest wysoce niedokładna.

c)      Zliczanie ilości wywiezionych pojemników o określonej objętości także budzi zastrzeżenia, ponieważ rzeczywiste krotności wypróżniania pojemników na odpady nie podlegają kontroli (szczególnie w skupiskach wielomieszkaniowych), ustalane są jedynie na podstawie zawartej umowy pomiędzy administratorem nieruchomości, a usługodawcą trudniącym się usuwaniem odpadów. Dane zawarte w umowie bywają zwykle tylko przybliżone, choćby z tego względu, że ustalają stałe krotności (miesięczne lub tygodniowe) opróżniania pojemników, a produktywność odpadów komunalnych nie jest stała.

  1. Należy sądzić, że po okresie wprowadzenia zasady ścisłego ewidencjonowania ilości (i rodzajów) wytarzanych odpadów (rok 2001), zastosowania miary masy (Mg) oraz stosownym okresie adaptacyjnym do wypełniania tych obowiązków – dane uzyskane za rok 2002 pozwolą na bardziej wiarygodną weryfikację modelu.
  2. Dane uzyskane za rok 2002 umożliwią także (w przypadku, gdyby dokonana predykcja z zastosowaniem danych ewidencyjnych za rok 2002 nadal wykazywała zbyt wysoki błąd względny predykcji) dokonanie przeliczenia według przyjętej procedury i określenia zweryfikowanej funkcji wyrażającej model.
  3. Na podstawie przytoczonych wniosków należy uznać za bezcelowe poszukiwanie modyfikacji opracowanego modelu z wykorzystaniem dotychczasowych danych statystycznych. Bardziej wiarygodne należy uznać dane z roku bieżącego. Uwzględniając fakt, iż rok jeszcze się nie zakończył – tę cechę wiarygodności należałoby przypisać bardziej danym za minione półrocze, niż danym za rok 2001.

 

 

Poniżej przedstawiam wykres dopasowania otrzymanych wyników do danych rzeczywistych.

 

 

Podsumowując wnioski okazuje się, że (mimo spełnienia założeń kolejnych kroków schematu tworzenia modeli ekonometrycznych przez mój model) obliczenia dokonywane na jego podstawie są obarczone zbyt znaczącym błędem, aby można było uznać je za wiarygodne.