Praca jest zabezpieczona przed kopiowaniem – wprowadzono wiele błędów obliczeniowych aby uniemożliwić łamanie praw autorskich.
Celem niniejszego projektu jest przedstawienie modelu ekonometrycznego dotyczącego wytwarzania odpadów komunalnych. Model ten może posłużyć do celów prognostycznych w przyszłych latach zarządzania odpadami. Podobne modele wykonuje się w „Wojewódzkich planach gospodarki odpadami”, gdzie informacje dostarczone przez model stanowią ważne dane planistyczne.
I. Specyfikacja zmiennych wraz z gromadzeniem danych:
Zmienne objaśniające mają wpływ na zmienną objaśnianą Y - wytwarzanie odpadów komunalnych, fakt ten został opisany w poradniku pt.: „Planowanie gospodarki odpadami w Polsce.
Dane zostały również pozyskane u Wojewódzkiego Inspektora Ochrony Środowiska (Wrocław, ul. Sienkiewicza 32) oraz w Głównym Urzędzie Statystycznym (Wrocław, ul. Oławska 31). Nazwy, źródła pozyskania oraz materiały opisujące wpływ danych na zmienną objaśnianą zostały przedstawione niżej:
Wszystkie dane dotyczą roku 2000
Y - odpady komunalne stałe (w ciągu roku) wywiezione w dam3, [ źródło: GUS];
X1 – gospodarstwa domowe w tyś., „Poradnik - wojewódzkie plany gospodarki odpadami” str. 45 p. 4.1.1 <Wytyczne> wersy: 16-32, [źródło: Rocznik Statystyczny 2001]; (ekonometria)
X2 – powierzchnia województw w km2, „Poradnik - wojewódzkie plany gospodarki odpadami” str.21 wersy: 3-5, ” str.40 p. 3.2<Podstawy prawne> i <Wytyczne> wersy: 1-26 [źródło: Rocznik Statystyczny 2001];
X3 – ludność w tyś., „Poradnik - wojewódzkie plany gospodarki odpadami” str.40-41 p. 3.3 <Wytyczne> wersy: 1-23, [źródło: Rocznik Statystyczny 2001];
X4 – wysypiska, „Poradnik - wojewódzkie plany gospodarki odpadami” str. 45 p. 4.1.1 <System SIGOP> wersy: 1-23 [źródło: Inspektor Ochrony Środowiska];
X5 – miasta, „Poradnik - wojewódzkie plany gospodarki odpadami” str.40 p. 3.2 <Wytyczne> wersy: 1-19 [źródło: Rocznik Statystyczny 2001];
Ekonometria i statystyka
X6 – miejscowości wiejskie, „Poradnik - wojewódzkie plany gospodarki odpadami” str.40 p. 3.2 <Wytyczne> wersy: 1-19 [źródło: Rocznik Statystyczny 2001];
Dobrane przeze mnie zmienne są na razie zbiorem potencjalnych zmiennych. Warunkiem wstępnym tego, aby dana zmienna X mogła być uznana za objaśniającą w modelu jest jej dostateczna zmienność liczona klasycznym współczynnikiem zmienności, który ma postać:

![]()
gdzie: s – odchylenie standardowe zmiennej X;
x – średnia arytmetyczna zmiennej X,
Wartość krytyczną przyjmuję V* = 0,10. Następnie sprawdzam, które zmienne spełniają nierówność Vj < V*. Zmienne spełniające tą nierówność uznaje się za mało zróżnicowane i eliminuje ze zbioru potencjalnych zmiennych objaśniających.
Wszystkie dane dotyczące zmiennych przedstawia poniższa tabelka:
|
L.P. |
Województwa |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
|
1 |
DOLNOŚLĄSKIE |
5899,2 |
860 |
19948 |
149 |
103 |
90 |
2927 |
|
2 |
KUJAWSKO-POMORSKIE |
2119,0 |
635 |
17970 |
117 |
53 |
52 |
3576 |
|
3 |
LUBELSKIE |
2161,1 |
710 |
25114 |
89 |
60 |
41 |
4205 |
|
4 |
LUBUSKIE |
1581,3 |
305 |
13984 |
73 |
57 |
42 |
1529 |
|
5 |
ŁÓDZKIE |
3429,5 |
992 |
18219 |
145 |
45 |
42 |
5187 |
|
6 |
MAŁOPOLSKIE |
3525,8 |
939 |
15144 |
214 |
50 |
55 |
2631 |
|
7 |
MAZOWIECKIE |
5682,7 |
1630 |
35579 |
143 |
75 |
84 |
9137 |
|
8 |
OPOLSKIE |
1285,2 |
335 |
9412 |
115 |
49 |
34 |
1559 |
|
9 |
PODKARPACKIE |
1937,5 |
553 |
17926 |
119 |
51 |
45 |
2158 |
|
10 |
PODLASKIE |
1252,9 |
344 |
20180 |
61 |
64 |
36 |
3947 |
|
11 |
POMORSKIE |
2983,0 |
550 |
18293 |
120 |
63 |
42 |
2994 |
|
12 |
ŚLĄSKIE |
7370,2 |
1221 |
12294 |
394 |
40 |
69 |
1518 |
|
13 |
ŚWIĘTOKRZYSKIE |
1048,6 |
413 |
11691 |
113 |
32 |
29 |
2843 |
|
14 |
WARMIŃSKO-MAZURSKIE |
2021,8 |
458 |
24203 |
61 |
64 |
49 |
3873 |
|
15 |
WIELKOPOLSKIE |
4108,4 |
994 |
29826 |
113 |
118 |
109 |
5516 |
|
xśrj |
|
3093,7 |
729,3 |
19318,9 |
135,1 |
61,6 |
54,6 |
3573,3 |
|
sj |
|
1920,53 |
376,38 |
7025,253 |
81,40153 |
22,69298 |
23,14797 |
1974,839 |
|
Vj |
|
0,620778 |
0,516108 |
0,363647 |
0,602677 |
0,368393 |
0,423956 |
0,55266 |
Ekonometria i statystyka
Z przeprowadzonych obliczeń wynika, że wszystkie zmienne są dostatecznie zróżnicowane (zmienność większa od 10%), więc nie odrzucamy żadnych.
Obliczam wartość krytyczną współczynnika korelacji r* na podstawie wzoru:
![]()
gdzie:
t - wartoś statystyki odczytana z tablic testu t- Studenta dla zadanego poziomu istotności a oraz dla n-2 stopni swobody;
n – ilość obserwacji;
a - poziom istotności.
Dla a = 0,05 i n = 15 wartość statystyki wynosi t = 2,160. Podstawiając do wzoru na r* otrzymujemy:
r* = 0,51
Dobór zmiennych objaśniających odbywa się wg następującej procedury:
1) Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
![]()
ponieważ są to zmienne nieistotnie skorelowane ze zmienną objaśnianą.
2) Spośród pozostałych potencjalnych zmiennych jako zmienną objaśniającą wybiera się taką zmienną Xh, dla której:
![]()
Jest to zmienna, która jest nośnikiem największego zasobu informacji o zmiennej o zmiennej objaśnianej.
3)
![]()
Ze zbioru pozostałych zmiennych objaśniających eliminuje się te wszystkie
zmienne, dla których:
Ekonometria i statystyka
są to bowiem zmienne zbyt silnie skorelowane ze zmienną objaśniającą Xh, a więc powielające dostarczone przez nią informacje.
W moim projekcie wygląda to następująco:
Wektor współczynników korelacji zmiennej objaśnianej z potencjalnymi zmiennymi objaśniającymi Ro oraz macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi R przedstawiają tabelki:
|
|
|
Y |
|
|
|
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
|
|
X1 |
0,85 |
|
|
X1 |
1,00 |
0,55 |
0,58 |
0,27 |
0,69 |
0,64 |
|
|
X2 |
0,29 |
|
|
X2 |
0,55 |
1,00 |
-0,27 |
0,65 |
0,60 |
0,88 |
|
Ro = |
X3 |
0,76 |
|
R = |
X3 |
0,58 |
-0,27 |
1,00 |
-0,23 |
0,29 |
-0,21 |
|
|
X4 |
0,34 |
|
|
X4 |
0,27 |
0,65 |
-0,23 |
1,00 |
0,81 |
0,41 |
|
|
X5 |
0,75 |
|
|
X5 |
0,69 |
0,60 |
0,29 |
0,81 |
1,00 |
0,45 |
|
|
X6 |
0,27 |
|
|
X6 |
0,64 |
0,88 |
-0,21 |
0,41 |
0,45 |
1,00 |
Realizując kolejne kroki procedury doboru zmiennych objaśniających dla a = 0,05 i
n = 15 (n-2 = 13), otrzymuję:
1) Usuwam te zmienne, których wartość rj jest mniejsza od r*. Są to zmienne X2, X4 i X6, gdyż są one nieistotnie skorelowane zmienną objaśnianą.
2) Spośród pozostałych zmiennych objaśniających wybieram do modelu zmienną X1, bo jest najmocniej skorelowana ze zmienną objaśnianą.
3) W tym punkcie ze zbioru proponowanych zmiennych objaśniających eliminuję te, dla których współczynniki korelacji ze zmienną X1 są wyższe niż r* = 0,51. Są to zmienne X3 i X5.
Pozostaje mi tylko zmienna X1 – opisująca ilość gospodarstw domowych, którą wprowadzam do modelu jako zmienną objaśniającą. W ten sposób powstaje model z jedną zmienną objaśniającą, który opisuje wybrane przeze mnie zjawisko.
Wprowadzam wszystkie wartości zmiennych do programu Microsoft Excel. Korzystając z funkcji analizy danych „Regresja” otrzymuję następujące dane:
Ekonometria i statystyka
|
PODSUMOWANIE - WYJŚCIE |
|
|
|
|
|
Statystyki regresji |
|
|
Wielokrotność R |
0,84824039 |
|
R kwadrat |
0,71951176 |
|
Dopasowany R kwadrat |
0,697935741 |
|
Błąd standardowy |
1055,5305 |
|
Obserwacje |
15 |
|
ANALIZA WARIANCJI |
|||||
|
|
df |
SS |
MS |
F |
Istotność F |
|
Regresja |
1 |
37154221,38 |
37154221,38 |
33,34775 |
6,44E-05 |
|
Resztkowy |
13 |
14483880,27 |
1114144,636 |
|
|
|
Razem |
14 |
51638101,66 |
|
|
|
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
|
Przecięcie |
-62,71020725 |
610,7729982 |
-0,10267351 |
0,919789 |
-1382,2 |
1256,784 |
|
Zmienna X 1 |
4,328261551 |
0,74951478 |
5,774751433 |
6,44E-05 |
2,709034 |
5,947489 |
|
SKŁADNIKI RESZTOWE - WYJŚCIE |
|||
|
|
|
|
|
|
Obserwacja |
Przewidywane Y |
Składniki resztowe |
Std. składniki resztowe |
|
1 |
3659,594727 |
2239,605273 |
2,201876904 |
|
2 |
2685,735878 |
-566,7358778 |
-0,557188651 |
|
3 |
3010,355494 |
-849,2554941 |
-0,834948944 |
|
4 |
1257,409566 |
323,8904341 |
0,318434179 |
|
5 |
4230,925252 |
-801,4252516 |
-0,787924449 |
|
6 |
4001,527389 |
-475,7273893 |
-0,46771329 |
|
7 |
6992,356121 |
-1309,656121 |
-1,287593667 |
|
8 |
1387,257412 |
-102,0574124 |
-0,100338154 |
|
9 |
2330,818431 |
-393,3184306 |
-0,386692592 |
|
10 |
1426,211766 |
-173,3117664 |
-0,170392158 |
|
11 |
2317,833646 |
665,1663541 |
0,653960968 |
|
12 |
5222,097147 |
2148,102853 |
2,111915933 |
|
13 |
1724,861813 |
-676,2618134 |
-0,664869513 |
|
14 |
1919,633583 |
102,1664168 |
0,100445322 |
|
15 |
4239,581775 |
-131,1817747 |
-0,128971888 |
Analizując postać analityczną modelu sporządzam wykres punktowy i na tej podstawie oceniam możliwą postać analityczną funkcji regresji. Do stworzenia wykresu potrzebuję dwóch zmiennych:
- objaśnianą: u mnie jest to Y – odpady komunalne stałe;
- objaśnianą: u mnie jest to X1 – gospodarstwa domowe, którą wyznaczyłem wyżej opisaną procedurą doboru zmiennych.
Ekonometria i statystyka

Wykres zawiera również prostą regresji liniowej, która pozwala ustalić rozrzut poszczególnych wartości. Ustalam, iż jest to zależność liniowa, a parametry mojej funkcji zostały oszacowane przez program i widnieją na wykresie. Ogólna postać funkcji wyraża się wzorem:
![]()
Korzystając z funkcji analizy danych „Regresja” w programie Macrosoft Excell otrzymuję następujące dane:
|
PODSUMOWANIE - WYJŚCIE |
|
|
|
|
|
Statystyki regresji |
|
|
Wielokrotność R |
0,832691989 |
|
R kwadrat |
0,693375949 |
|
Dopasowany R kwadrat |
0,665501035 |
|
Błąd standardowy |
4,855265195 |
|
Obserwacje |
13 |
Ekonometria i statystyka
|
ANALIZA WARIANCJI |
|
|
|
|
|
|
|
df |
SS |
MS |
F |
Istotność F |
|
Regresja |
1 |
586,382706 |
586,3827064 |
24,87455 |
0,000410587 |
|
Resztkowy |
11 |
259,309601 |
23,57360011 |
|
|
|
Razem |
12 |
845,692308 |
|
|
|
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
|
Przecięcie |
1,446 |
3,36855916 |
0,429406591 |
0,675917 |
-5,96767096 |
8,860633968 |
|
Zmienna X 1 |
0,089 |
0,01790365 |
4,987439272 |
0,000411 |
0,049887682 |
0,128699062 |
|
SKŁADNIKI RESZTOWE - WYJŚCIE |
|
||
|
|
|
|
|
|
Obserwacja |
Przewidywane Y |
Składniki resztowe |
Std. składniki resztowe |
|
1 |
3,589522437 |
-2,589522437 |
-0,557058753 |
|
2 |
12,87603314 |
-8,876033144 |
-1,909414603 |
|
3 |
7,161257324 |
1,838742676 |
0,395550812 |
|
4 |
18,05504873 |
2,944951269 |
0,633518698 |
|
5 |
13,94755361 |
9,052446389 |
1,947364667 |
|
6 |
17,25140838 |
0,748591619 |
0,161037227 |
|
7 |
27,34155944 |
-6,341559439 |
-1,364197947 |
|
8 |
21,3589035 |
2,641096498 |
0,568153379 |
|
9 |
28,77025339 |
3,229746606 |
0,694783946 |
|
10 |
14,21543373 |
1,784566273 |
0,38389637 |
|
11 |
19,93020955 |
-0,930209547 |
-0,200106924 |
|
12 |
16,35847466 |
0,64152534 |
0,138005101 |
|
13 |
18,1443421 |
-4,144342103 |
-0,891531972 |
Następnie sporządzam wykres punktowy, na którego podstawie oceniam możliwą postać analityczną funkcji regresji.