Praca jest zabezpieczona przed kopiowaniem – wprowadzono wiele błędów obliczeniowych aby uniemożliwić łamanie praw autorskich.
1.Homoscedastyczność – stałość wariancji:
Stawiamy hipotezę:
H0: s12 = s22 (są równe w obu grupach)
przeciwko H1: s12 <> s22 (nie są równe).
Na wykresie przedstawiam kwadraty reszt otrzymane po zastosowaniu MNK:

Próbę n = 15 dzielimy na dwie podgrupy (n1 i n2). Z wykresu wynika, że wariancje w tych podgrupach mogą być różne. Wariancje przyjmują szczególnie dużą wartość dla trzech spośród dwunastu pierwszych okresów. Dlatego też decyduję się przyjąć n1=12 oraz n2=3. Stosując MNK szacuję wektory parametrów dla pierwszych dwunastu okresów oraz dla trzech ostatnich okresów. Wszystkie obliczenia dokonuję w programie Microsoft Excel funkcją „Regresja”.
Hipotezę weryfikujemy wykorzystując następującą statystykę:

Statystyka
gdzie:
-
wariancja reszt modelu regresji dla podgrupy o większej
wariancji;
-
wariancja reszt modelu regresji dla podgrupy o
mniejszej wariancji.
· Dla n1 otrzymałem:
|
Statystyki regresji |
|
|
Wielokrotność R |
0,830407271 |
|
R kwadrat |
0,689576236 |
|
Dopasowany R kwadrat |
0,658533859 |
|
Błąd standardowy |
1180,70637 |
|
Obserwacje |
12 |
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
|
Przecięcie |
70,50854977 |
759,403281 |
0,092847 |
0,927859 |
-1621,55 |
1762,565 |
|
X1 |
4,229810161 |
0,897443701 |
4,713176 |
0,000825 |
2,230181 |
6,22944 |
Więc: y=4,2298x + 70,509
· Dla n2 otrzymałem:
|
Statystyki regresji |
|
|
Wielokrotność R |
0,96968481 |
|
R kwadrat |
0,940288631 |
|
Dopasowany R kwadrat |
0,880577261 |
|
Błąd standardowy |
540,2380107 |
|
Obserwacje |
3 |
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
|
Przecięcie |
-522,5631615 |
798,1671525 |
-0,654703917 |
0,630967 |
-10664,2 |
9619,069 |
|
X1 |
4,689806694 |
1,181824163 |
3,96827789 |
0,157155 |
-10,3266 |
19,70624 |
Więc: y=4,6898x + 522,56
Na podstawie tych równań wyznaczyłem reszty:
|
Obserwacja |
ei |
ei2 |
|
Obserwacja |
ei |
ei2 |
|
1 |
2191,054712 |
4800720,749 |
|
13 |
-365,727 |
133756,2 |
|
2 |
-637,4380021 |
406327,2066 |
|
14 |
396,4317 |
157158,1 |
|
3 |
-912,5737642 |
832790,8752 |
|
15 |
-30,7047 |
942,7781 |
|
4 |
220,6993511 |
48708,20356 |
|
SUMA |
|
291857,1 |
|
5 |
-836,9802297 |
700535,9049 |
|
|
|
|
|
6 |
-516,5002911 |
266772,5507 |
|
|
|
|
|
7 |
-1282,399113 |
1644547,484 |
|
|
|
|
|
8 |
-202,2949538 |
40923,24832 |
|
|
|
|
|
9 |
-472,0935689 |
222872,3378 |
|
|
|
|
|
10 |
-272,6632452 |
74345,24529 |
|
|
|
|
|
11 |
586,0958616 |
343508,3589 |
|
|
|
|
|
12 |
2135,093243 |
4558623,158 |
|
|
|
|
|
SUMA |
|
13940675,32 |
|
|
|
|
Obliczam Se2:
S12 = 1394067,532 oraz S22 = 291857,1083
Podstawiając do wzoru na F otrzymuję:
Fobl = 0,209356506
Dla n1 – m – 1 =10 (w liczniku) i n2 – m – 1 = 1 (w mianowniku) oraz dla poziomu istotności a = 0,05 wartość krytyczna F* wynosi:
F* = 242
Ponieważ Fobl <
F* = 242, zatem nie ma podstaw do odrzucenia hipotezy zerowej na
poziomie istotności
=0,05, co
oznacza, że wariancja mojego modelu jest stała.
1. Analiza wpływów:
W danych wykorzystywanych do budowy modelu ekonometrycznego często występują obserwacje odróżniające się pewnymi cechami od pozostałych. Wyróżnia się dwa rodzaje takich obserwacji: nietypowe i wpływowe. Kryterium wyróżniającym te obserwacje są skutki ich oddziaływania na model ekonometryczny.
Obserwacja nietypowa charakteryzuje się dużą resztą, czyli różnicą między wartością rzeczywistą zmiennej objaśniającej a wartością teoretyczną tej zmiennej wynikającą z modelu ekonometrycznego.
Obserwację uważa się za wpływową, jeśli w wyniku nieznacznej zmiany jej wartości (przesuwania jej) lub usunięcia z danych znacznie zmieniają się oszacowane parametry modelu. Wartości reszt obserwacji wpływowych nie są duże.
Poniższa tabela przedstawia wartości bezwzględne reszt I ei I oraz wartości zmiennej objaśniającej X1 i zmiennej objaśnianej Y.
|
L.p. |
I ei I |
Y |
X1 |
|
1 |
2239,6 |
5899,2 |
860 |
|
2 |
566,7 |
2119,0 |
635 |
|
3 |
849,3 |
2161,1 |
710 |
|
4 |
323,9 |
1581,3 |
305 |
|
5 |
801,4 |
3429,5 |
992 |
|
6 |
475,7 |
3525,8 |
939 |
|
7 |
1309,7 |
5682,7 |
1630 |
|
8 |
102,1 |
1285,2 |
335 |
|
9 |
393,3 |
1937,5 |
553 |
|
10 |
173,3 |
1252,9 |
344 |
|
11 |
665,2 |
2983,0 |
550 |
|
12 |
2148,1 |
7370,2 |
1221 |
|
13 |
676,3 |
1048,6 |
413 |
|
14 |
102,2 |
2021,8 |
458 |
|
15 |
131,2 |
4108,4 |
994 |

Za obserwacje nietypowe uznałem obserwację 1, 7 i 12. Teraz badam jak zmieni się model po usunięciu każdej ze zmiennych. Zmiany w parametrach modelu są pokazane w równaniu obok wykresu wraz ze współczynnikiem determinacji R2.
Po usunięciu pierwszej obserwacji współczynnik determinacji wzrósł z 0,7195 do 0,7903 i dopasowanie modelu się poprawiło.

Po usunięciu obserwacji 7 z danych model nieznacznie się zmienił a dopasowanie modelu minimalnie się poprawiło.
Ekonometria i statystyka

Usuwając obserwację 12 z danych dopasowanie modelu zmienia się w najmniejszym stopniu w porównaniu z poprzednimi obserwacjami.

Przedstawione obserwacje są obserwacjami wpływowymi w modelu ekonometrycznym, oraz są obserwacjami nietypowymi ze względu na każdą ze zmiennych oddzielnie występujących w modelu (znacznie odbiegające reszty od pozostałych). Dobrze pokazuje to poniższy wykres, na którym zostały usunięte obserwacje 1, 7 i 12. Widzimy, że linia trendu nie zmieniła swojego kierunku w jakiś znaczący sposób, ale oszacowane parametry modelu zmieniają się znacznie.
Ekonometria i statystyka

Po usunięciu wszystkich nietypowych obserwacji dopasowanie modelu jest największe
( R2 = 0,8258 ).
II. Predykcja na podstawie modelu (prognoza i jej ocena):
Prognozowanie ilości wywiezionych odpadów komunalnych stałych w województwie zachodnio – pomorskim można przeprowadzić podstawiając do skonstruowanego modelu rzeczywistej wartości zmiennej objaśniającej:
Dane dla województwa zachodnio – pomorskiego:
Y = 3413,5
X1 = 511
Model ekonometryczny ma postać:
Y = 4,3283X1 - 62,7102
Podstawiając do modelu rzeczywistą wartość X1 otrzymujemy:
Y = 4,3283*511 - 62,7102 = 2149,051
Błąd predykcji:
Ekonometria i statystyka
![]()
gdzie:
Yp – prognozowana wartość Y w woj. zachodnio – pomorskim
Yr – rzeczywista wartość Y w woj. zachodnio – pomorskim
d = ½2149,051 - 3413,5½= 1264,4
Błąd względny predykcji:
V = (d / Yr) * 100%
V = (1264,4/ 3413,5) * 100% = 37,04%
III. Wnioski:
Zastrzeżenia do zgromadzonych danych statystycznych wynikają z następujących faktów:
a) Ścisłą ewidencję wytwarzanych odpadów wprowadzono w roku 2001, stąd dane statystyczne o ilościach odpadów, wywiezionych z miejsc ich wytwarzania, pochodzące z roku 2000, są jedynie przybliżone;
b) Zastosowana miara ilości wywiezionych odpadów (m3) umożliwia dokonywanie ewidencji na podstawie ilości wywiezionych odpadów stałych, zgromadzonych w pojemnikach o standaryzowanej pojemności: 110 dcm3 (0,11m3), 1.100 dcm3 (1,1 m3), 7 m3, 10 m3. Ponieważ jednak stopień wypełnienia tych pojemników nie podlega kontroli, stąd dokonywana ewidencja jest wysoce niedokładna.
c) Zliczanie ilości wywiezionych pojemników o określonej objętości także budzi zastrzeżenia, ponieważ rzeczywiste krotności wypróżniania pojemników na odpady nie podlegają kontroli (szczególnie w skupiskach wielomieszkaniowych), ustalane są jedynie na podstawie zawartej umowy pomiędzy administratorem nieruchomości, a usługodawcą trudniącym się usuwaniem odpadów. Dane zawarte w umowie bywają zwykle tylko przybliżone, choćby z tego względu, że ustalają stałe krotności (miesięczne lub tygodniowe) opróżniania pojemników, a produktywność odpadów komunalnych nie jest stała.
Poniżej przedstawiam wykres dopasowania otrzymanych wyników do danych rzeczywistych.

Podsumowując wnioski okazuje się, że (mimo spełnienia założeń kolejnych kroków schematu tworzenia modeli ekonometrycznych przez mój model) obliczenia dokonywane na jego podstawie są obarczone zbyt znaczącym błędem, aby można było uznać je za wiarygodne.