Ekonometria – model ekonometryczny cz.1

Praca jest zabezpieczona przed kopiowaniem – wprowadzono wiele błędów obliczeniowych aby uniemożliwić łamanie praw autorskich.

 

 

Celem niniejszego projektu jest przedstawienie modelu ekonometrycznego dotyczącego wytwarzania odpadów komunalnych. Model ten może posłużyć do celów prognostycznych w przyszłych latach zarządzania odpadami. Podobne modele wykonuje się w „Wojewódzkich planach gospodarki odpadami”, gdzie informacje dostarczone przez model stanowią ważne dane planistyczne.

 

 

 

 

I.                   Specyfikacja zmiennych wraz z gromadzeniem danych:

 

  1. Opis zmiennych:

 

Zmienne objaśniające mają wpływ na zmienną objaśnianą Y - wytwarzanie odpadów komunalnych, fakt ten został opisany w poradniku pt.: „Planowanie gospodarki odpadami w Polsce.

Dane zostały również pozyskane u Wojewódzkiego Inspektora Ochrony Środowiska (Wrocław, ul. Sienkiewicza 32) oraz w Głównym Urzędzie Statystycznym (Wrocław, ul. Oławska 31). Nazwy, źródła pozyskania oraz materiały opisujące wpływ danych na zmienną objaśnianą zostały przedstawione niżej:

 

Wszystkie dane dotyczą roku 2000

 

Y - odpady komunalne stałe (w ciągu roku) wywiezione w dam3, [ źródło: GUS];

 

X1gospodarstwa domowe w tyś., „Poradnik - wojewódzkie plany gospodarki odpadami” str. 45 p. 4.1.1 <Wytyczne> wersy: 16-32, [źródło: Rocznik Statystyczny 2001]; (ekonometria)

 

X2powierzchnia województw w km2, „Poradnik - wojewódzkie plany gospodarki odpadami” str.21 wersy: 3-5, ” str.40 p. 3.2<Podstawy prawne> i <Wytyczne> wersy: 1-26 [źródło: Rocznik Statystyczny 2001];

 

X3 ludność w tyś., „Poradnik - wojewódzkie plany gospodarki odpadami” str.40-41 p. 3.3 <Wytyczne> wersy: 1-23, [źródło: Rocznik Statystyczny 2001];

 

X4wysypiska, „Poradnik - wojewódzkie plany gospodarki odpadami” str. 45 p. 4.1.1 <System SIGOP> wersy: 1-23 [źródło: Inspektor Ochrony Środowiska];

 

X5 miasta, „Poradnik - wojewódzkie plany gospodarki odpadami” str.40 p. 3.2 <Wytyczne> wersy: 1-19 [źródło: Rocznik Statystyczny 2001];

 

 

Ekonometria i statystyka

 

X6miejscowości wiejskie, „Poradnik - wojewódzkie plany gospodarki odpadami” str.40 p. 3.2 <Wytyczne> wersy: 1-19 [źródło: Rocznik Statystyczny 2001];

 

 

 

  1. Badanie współczynnika zmienności:

 

Dobrane przeze mnie zmienne są na razie zbiorem potencjalnych zmiennych. Warunkiem wstępnym tego, aby dana zmienna X mogła być uznana za objaśniającą w modelu jest jej dostateczna zmienność liczona klasycznym współczynnikiem zmienności, który ma postać:


      

 

 

 

 

gdzie: s – odchylenie standardowe zmiennej X;

                  x – średnia arytmetyczna zmiennej X,

 

Wartość krytyczną przyjmuję V* = 0,10. Następnie sprawdzam, które zmienne spełniają nierówność Vj < V*. Zmienne spełniające tą nierówność uznaje się za mało zróżnicowane i eliminuje ze zbioru potencjalnych zmiennych objaśniających.

 

Wszystkie dane dotyczące zmiennych przedstawia poniższa tabelka:

 

L.P.

Województwa

Y

X1

X2

X3

X4

X5

X6

1

DOLNOŚLĄSKIE

5899,2

860

19948

149

103

90

2927

2

KUJAWSKO-POMORSKIE

2119,0

635

17970

117

53

52

3576

3

LUBELSKIE

2161,1

710

25114

89

60

41

4205

4

LUBUSKIE

1581,3

305

13984

73

57

42

1529

5

ŁÓDZKIE

3429,5

992

18219

145

45

42

5187

6

MAŁOPOLSKIE

3525,8

939

15144

214

50

55

2631

7

MAZOWIECKIE

5682,7

1630

35579

143

75

84

9137

8

OPOLSKIE

1285,2

335

9412

115

49

34

1559

9

PODKARPACKIE

1937,5

553

17926

119

51

45

2158

10

PODLASKIE

1252,9

344

20180

61

64

36

3947

11

POMORSKIE

2983,0

550

18293

120

63

42

2994

12

ŚLĄSKIE

7370,2

1221

12294

394

40

69

1518

13

ŚWIĘTOKRZYSKIE

1048,6

413

11691

113

32

29

2843

14

WARMIŃSKO-MAZURSKIE

2021,8

458

24203

61

64

49

3873

15

WIELKOPOLSKIE

4108,4

994

29826

113

118

109

5516

xśrj

 

3093,7

729,3

19318,9

135,1

61,6

54,6

3573,3

sj

 

1920,53

376,38

7025,253

81,40153

22,69298

23,14797

1974,839

Vj

 

0,620778

0,516108

0,363647

0,602677

0,368393

0,423956

0,55266

Ekonometria i statystyka

 

Z przeprowadzonych obliczeń wynika, że wszystkie zmienne są dostatecznie zróżnicowane (zmienność większa od 10%), więc nie odrzucamy żadnych.

 

 

 

  1. Dobór zmiennych objaśniających do modelu metodą analizy współczynników korelacji:

 

Obliczam wartość krytyczną współczynnika korelacji r* na podstawie wzoru:

 


 

gdzie:

 

t - wartoś statystyki odczytana z tablic testu t- Studenta dla zadanego poziomu istotności a oraz dla n-2 stopni swobody;

n – ilość obserwacji;

a - poziom istotności.

 

Dla a = 0,05 i n = 15 wartość statystyki wynosi t = 2,160. Podstawiając do wzoru na r* otrzymujemy:

r* = 0,51

 

Dobór zmiennych objaśniających odbywa się wg następującej procedury:

 

1)      Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:


 

ponieważ są to zmienne nieistotnie skorelowane ze zmienną objaśnianą.

 

2)      Spośród pozostałych potencjalnych zmiennych jako zmienną objaśniającą wybiera się taką zmienną Xh, dla której:

 


 

Jest to zmienna, która jest nośnikiem największego zasobu informacji o zmiennej o zmiennej objaśnianej.

 

3)     
Ze zbioru pozostałych zmiennych objaśniających eliminuje się te wszystkie zmienne, dla których:

 

Ekonometria i statystyka

 

 

są to bowiem zmienne zbyt silnie skorelowane ze zmienną objaśniającą Xh, a więc powielające dostarczone przez nią informacje.

 

 

 

 

 

W moim projekcie wygląda to następująco:

 

Wektor współczynników korelacji zmiennej objaśnianej z potencjalnymi zmiennymi objaśniającymi Ro oraz macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi R przedstawiają tabelki:

 

 

 

Y

 

 

 

X1

X2

X3

X4

X5

X6

 

X1

0,85

 

 

X1

1,00

0,55

0,58

0,27

0,69

0,64

 

X2

0,29

 

 

X2

0,55

1,00

-0,27

0,65

0,60

0,88

Ro =

X3

0,76

 

R =

X3

0,58

-0,27

1,00

-0,23

0,29

-0,21

 

X4

0,34

 

 

X4

0,27

0,65

-0,23

1,00

0,81

0,41

 

X5

0,75

 

 

X5

0,69

0,60

0,29

0,81

1,00

0,45

 

X6

0,27

 

 

X6

0,64

0,88

-0,21

0,41

0,45

1,00

 

 

 

Realizując kolejne kroki procedury doboru zmiennych objaśniających dla a = 0,05 i

n = 15 (n-2 = 13), otrzymuję:

 

1) Usuwam te zmienne, których wartość rj jest mniejsza od r*. Są to zmienne X2, X4 i X6, gdyż są one nieistotnie skorelowane zmienną objaśnianą.

 

2) Spośród pozostałych zmiennych objaśniających wybieram do modelu zmienną X1, bo jest najmocniej skorelowana ze zmienną objaśnianą.

 

3) W tym punkcie ze zbioru proponowanych zmiennych objaśniających eliminuję te, dla których współczynniki korelacji ze zmienną X1 są wyższe niż r* = 0,51. Są to zmienne X3 i X5.

 

Pozostaje mi tylko zmienna X1 – opisująca ilość gospodarstw domowych, którą wprowadzam do modelu jako zmienną objaśniającą. W ten sposób powstaje model z jedną zmienną objaśniającą, który opisuje wybrane przeze mnie zjawisko.

 

 

 

  1. Analiza regresji:

 

Wprowadzam wszystkie wartości zmiennych do programu Microsoft Excel. Korzystając z funkcji analizy danych „Regresja” otrzymuję następujące dane:

 

Ekonometria i statystyka

 

PODSUMOWANIE - WYJŚCIE

 

 

Statystyki regresji

 

Wielokrotność R

0,84824039

R kwadrat

0,71951176

Dopasowany R kwadrat

0,697935741

Błąd standardowy

1055,5305

Obserwacje

15

 

 

ANALIZA WARIANCJI

 

df

SS

MS

F

Istotność F

Regresja

1

37154221,38

37154221,38

33,34775

6,44E-05

Resztkowy

13

14483880,27

1114144,636

 

 

Razem

14

51638101,66

 

 

 

 

 

 

Współczynniki

Błąd standardowy

t Stat

Wartość-p

Dolne 95%

Górne 95%

Przecięcie

-62,71020725

610,7729982

-0,10267351

0,919789

-1382,2

1256,784

Zmienna X 1

4,328261551

0,74951478

5,774751433

6,44E-05

2,709034

5,947489

 

 

SKŁADNIKI RESZTOWE - WYJŚCIE

 

 

 

 

Obserwacja

Przewidywane Y

Składniki resztowe

Std. składniki resztowe

1

3659,594727

2239,605273

2,201876904

2

2685,735878

-566,7358778

-0,557188651

3

3010,355494

-849,2554941

-0,834948944

4

1257,409566

323,8904341

0,318434179

5

4230,925252

-801,4252516

-0,787924449

6

4001,527389

-475,7273893

-0,46771329

7

6992,356121

-1309,656121

-1,287593667

8

1387,257412

-102,0574124

-0,100338154

9

2330,818431

-393,3184306

-0,386692592

10

1426,211766

-173,3117664

-0,170392158

11

2317,833646

665,1663541

0,653960968

12

5222,097147

2148,102853

2,111915933

13

1724,861813

-676,2618134

-0,664869513

14

1919,633583

102,1664168

0,100445322

15

4239,581775

-131,1817747

-0,128971888

 

 

 

Analizując postać analityczną modelu sporządzam wykres punktowy i na tej podstawie oceniam możliwą postać analityczną funkcji regresji. Do stworzenia wykresu potrzebuję dwóch zmiennych:

- objaśnianą: u mnie jest to Y – odpady komunalne stałe;

- objaśnianą: u mnie jest to X1 – gospodarstwa domowe, którą wyznaczyłem wyżej opisaną procedurą doboru zmiennych.

 Ekonometria i statystyka

 

 

 

Wykres zawiera również prostą regresji liniowej, która pozwala ustalić rozrzut poszczególnych wartości. Ustalam, iż jest to zależność liniowa, a parametry mojej funkcji zostały oszacowane przez program i widnieją na wykresie. Ogólna postać funkcji wyraża się wzorem:


 

 

 

  1.  Analiza regresji:

 

 Korzystając z funkcji analizy danych „Regresja”  w programie Macrosoft Excell otrzymuję następujące dane:

 

 

PODSUMOWANIE - WYJŚCIE

 

 

Statystyki regresji

Wielokrotność R

0,832691989

R kwadrat

0,693375949

Dopasowany R kwadrat

0,665501035

Błąd standardowy

4,855265195

Obserwacje

13

 

 

 

 

 

 

 

 

Ekonometria i statystyka

 

 

ANALIZA WARIANCJI

 

 

 

 

 

 

df

SS

MS

F

Istotność F

Regresja

1

586,382706

586,3827064

24,87455

0,000410587

Resztkowy

11

259,309601

23,57360011

 

 

Razem

12

845,692308

 

 

 

 

 

Współczynniki

Błąd standardowy

t Stat

Wartość-p

Dolne 95%

Górne 95%

Przecięcie

1,446

3,36855916

0,429406591

0,675917

-5,96767096

8,860633968

Zmienna X 1

0,089

0,01790365

4,987439272

0,000411

0,049887682

0,128699062

 

SKŁADNIKI RESZTOWE - WYJŚCIE

 

 

 

 

 

Obserwacja

Przewidywane Y

Składniki resztowe

Std. składniki resztowe

1

3,589522437

-2,589522437

-0,557058753

2

12,87603314

-8,876033144

-1,909414603

3

7,161257324

1,838742676

0,395550812

4

18,05504873

2,944951269

0,633518698

5

13,94755361

9,052446389

1,947364667

6

17,25140838

0,748591619

0,161037227

7

27,34155944

-6,341559439

-1,364197947

8

21,3589035

2,641096498

0,568153379

9

28,77025339

3,229746606

0,694783946

10

14,21543373

1,784566273

0,38389637

11

19,93020955

-0,930209547

-0,200106924

12

16,35847466

0,64152534

0,138005101

13

18,1443421

-4,144342103

-0,891531972

 

 

Następnie sporządzam wykres punktowy, na którego podstawie oceniam możliwą postać analityczną funkcji regresji.