Kapitel 12$\quad$Das lineare Regressionsmodell

Aufgabe 1$\quad$Es bezeichnen $Y_i$ die Nahrungsmittelausgaben im Jahr $i$ und $x_i$ die gesamten Konsumausgaben im Jahr $i$, $i=1,2,\ldots, n$. Unterstellen Sie das lineare Modell \[
Y_i = a + b \, x_i + \varepsilon_i \, .\]
Bekannt sind weiterhin die mittleren quadratischen Abweichungen $d_x^2$ und $d_y^2$ und die empirische Kovarianz $d_{xy}$.


1.1$\quad$Bestimmen Sie den Kleinste-Quadrate-Schätzwert für den Steigungsparameter. \[ \fbox{a} \ d_{xy}  \quad \fbox{b} \ d_{xy}^2 \quad \fbox{c} \ \frac{1}{d_x^2} \quad \fbox{d} \ \frac{1}{d_x}  \quad \fbox{e} \ \frac{1}{d_y^2} \quad \fbox{f} \ \frac{1}{d_y} \]

Der Schätzwert ist gegeben durch   

Hinweis: Abschnitt 3.5 und 12.1.



1.2
$\quad$Bestimmen Sie das Bestimmtheitsmaß $R^2$. \[ \fbox{a} \ d_{xy}  \quad \fbox{b} \ d_{xy}^2 \quad \fbox{c} \ \frac{1}{d_x^2} \quad \fbox{d} \ \frac{1}{d_x}  \quad \fbox{e} \ \frac{1}{d_y^2} \quad \fbox{f} \ \frac{1}{d_y} \]

Das Bestimmtheitsmaß ist gegeben durch   

Hinweis: Abschnitt 3.4 und 3.5.



Aufgabe 2
$\quad$Im Rahmen eines linearen Regressionsmodells,
\[
y_i = \hat{a} +  \hat{b} \, x_i + \hat{\varepsilon}_i \, , \quad i=1, \ldots, n \, ,
\]
wurden das Bestimmtheitmaß $R^2$ und die mittleren quadratischen Abweichungen $d_x^2$ und $d_y^2$ berechnet. Welchen Wert ergibt dann die erwartungstreue Schätzung der Fehlertermvarianz $\sigma^2 = \mbox{Var} (\varepsilon_i)$? \[ \fbox{a} \ (1-R)^2  \quad \fbox{b} \ (1-R^2) \quad \fbox{c} \ d_x^2 \quad \fbox{d} \ d_y^2  \quad \fbox{e} \ \frac{1}{n} \quad \fbox{f} \ \frac{n}{n-2} \]

Die erwartungstreue Varianzschätzung ist gegeben durch   

Hinweis: Abschnitt 12.1.



Aufgabe 3
$\quad$Im Rahmen eines linearen Regressionsmodells,
\[
y_i = \hat{a} +  \hat{b} \, x_i + \hat{\varepsilon}_i \, , \quad i=1, \ldots, 118 \, ,
\]
wurde die Steigung mit $\hat{b} = 1.38$ nach der Methode der kleinsten Quadrate geschätzt. Weiterhin ergab sich $d_x^2 = 9.82$ und $\widehat{\sigma}^2 = 3.66$. Betrachten Sie den (approximativen) Test auf
\[
H_0: \ b= 1 \quad \mbox{vs.} \quad H_1: \ b \neq 1 \, .
\] Geben Sie alle richtigen Antworten an.


$\fbox{a}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 25 \%$ nicht abgelehnt werden.
$\fbox{b}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 10 \%$ nicht abgelehnt werden.
$\fbox{c}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 5 \%$ nicht abgelehnt werden.
$\fbox{d}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 1 \%$ nicht abgelehnt werden.
$\fbox{e}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 5 \%$ abgelehnt werden.
$\fbox{f}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 1 \%$ abgelehnt werden.

Folgende Behauptungen sind richtig

Hinweis: Abschnitt 12.2.



Aufgabe 4
$\quad$Im Rahmen eines linearen Regressionsmodells,
\[
y_i = \hat{a} +  \hat{b} \, x_i + \hat{\varepsilon}_i \, , \quad i=1, \ldots, 187 \, ,
\]
ergaben sich folgende Werte (mit der üblichen Notation):
\[
\hat b = 0.17 \, , \quad d_x^2 = 8.88 \quad \sum_{i=1}^{187} \hat{\varepsilon}_i^2 = 8286.288 \, .
\]
Bestimmen Sie den Wert der $T$-Statistik $t_b$ auf die Nullhypothese der Unkorreliertheit. \[ \fbox{a} \ \sqrt{187 d_{x}^2}  \quad \fbox{b} \ \frac{\sqrt{185}}{\sqrt{\sum_{i=1}^{187} \hat{\varepsilon}_i^2}} \quad \fbox{c} \ \hat b \quad \fbox{d} \ 185 d_{x}^2  \quad \fbox{e} \ \frac{{185}}{\sqrt{\sum_{i=1}^{187} \hat{\varepsilon}_i^2}} \quad \fbox{f} \ \frac{187}{\sqrt{\sum_{i=1}^{187} \hat{\varepsilon}_i^2}} \]

Der Wert der $T$-Statistik ist gegeben durch   

Hinweis: Abschnitt 12.2.



Aufgabe 5
$\quad$Im Rahmen eines linearen Regressionsmodells,
\[
y_i = \hat{a} +  \hat{b} \, x_i + \hat{\varepsilon}_i \, , \quad i=1, \ldots, n \, ,
\]
ergaben sich nach der Kleinste-Quadrate-Methode $\hat b$ samt der Varianzschätzung für den Schätzer, $\hat \sigma_b^2$. Bestimmen Sie das realisierte Konfidenzintervall der Gestalt $[A; B]$ für den Steigungsparameter bei einem Konfidenzniveau von $95\%$. Da $n$ groß ist, dürfen Sie mit den Quantilen $z_p$ der Standardnormalverteilung argumentieren.
\[ \fbox{a} \ \left[ \hat b - z_{0.975} \hat \sigma_b^2;  \right. \quad \fbox{b} \ \left[ \hat b - z_{0.975} \hat \sigma_b;  \right. \quad \fbox{c} \ \left[ \hat b - z_{0.975} \frac{\hat \sigma_b}{\sqrt{n}};  \right. \quad \fbox{d} \ \left. \hat b + z_{0.975} \hat \sigma_b  \right]   \quad \fbox{e} \ \left. \hat b - z_{0.975} \hat \sigma_b^2 \right] \quad \fbox{f} \ \left. \hat b + z_{0.975} \hat \sigma_b^2 \right]   \]

Das Konfidenzintervall lautet   

Hinweis: Abschnitt 12.2.



Aufgabe 6
$\quad$Es bezeichne $x_i$ den Umsatz eines Gutes in Filiale $i$ vor Beginn einer Werbekampagne, $i=1, \ldots, 500$. Es stehe $y_i$ für den entsprechenden Umsatz nach der Kampagne. Im Rahmen eines linearen Regressionsmodells,
\[
y_i = \hat{a} +  \hat{b} \, x_i + \hat{\varepsilon}_i \, , \quad i=1, \ldots, n \, ,
\]
ergaben sich nach der Kleinste-Quadrate-Methode $\hat a = 1807$, $\hat b = 0.91$ samt der Varianzschätzung für den Steigungsparameter, $\hat \sigma_b^2 = 0.0963$. Getestet werden soll aufgrund einer Normalverteilungsapproximation die Nullhypothese $H_0$: $b = 1$ gegen die Alternativhypothese $H_1$: $b < 1$. Bestimmen Sie den $P$-Wert und geben Sie dann alle richtigen Antworten an.

$\fbox{a}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 5 \%$ abgelehnt werden.
$\fbox{b}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 10 \%$ abgelehnt werden.
$\fbox{c}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 20 \%$ abgelehnt werden.
$\fbox{d}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 30 \%$ abgelehnt werden.
$\fbox{e}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 40 \%$ abgelehnt werden.
$\fbox{f}$ Die Nullhypothese kann zu einem Niveau von $\alpha = 50 \%$ abgelehnt werden.

Folgende Behauptungen sind richtig

Hinweis: Abschnitt 10.3 und 12.2.



Aufgabe 7
$\quad$Die schulische Leistung ($y$ in Punkten) und das elterliche Einkommen ($x$ in Geldeinheiten) seien im Mittel durch das Modell $y = a + b \cdot \log (x)$ verknüpft. Der Steigungsparameter wird als bekannt vorausgesetzt, $b=70$. Betrachten wir einen Haushalt mit einem Einkommen von $x=1000$ Einheiten und nehmen wir an, dieses erhöhe sich um $\Delta x = 10$ Einheiten. Um wieviel Punkte ist dann (approximativ) ein Anstieg der schulischen Leistung ($\Delta y$) zu erwarten? \[ \fbox{a} \ 0.3 \quad \fbox{b} \ 0.4 \quad \fbox{c} \ 0.5 \quad \fbox{d} \ 0.6   \quad \fbox{e} \ 0.7 \quad \fbox{f} \ 0.8   \]

Der zu erwartende Anstieg beträgt ungefähr   

Hinweis: Abschnitt 12.3.



Aufgabe 8
$\quad$In der ökonomischen Theorie  wird oft ein Zusammenhang zwischen Nachfrage ($Y_i$), Preis ($x_{i,2}$) und Einkommen ($x_{i,3}$) postuliert. Diese Behauptung wollen wir durch eine lineare Regressionsanalyse,
\[
Y_i = \beta_1 + \beta_2 \, x_{i,2} + \beta_3 \, x_{i,3}+
\varepsilon_i \, , \quad i=1,\ldots, 30 \, ,
\]
überprüfen, wobei die Störterme ($\varepsilon_i$) als normalverteilt angesehen werden dürfen. Kürzer schreiben wir bekanntlich matriziell:
\[
 \boldsymbol{y}=\boldsymbol{X}\,\boldsymbol{\beta}+\boldsymbol{\varepsilon}
\]
mit $\boldsymbol{\beta}'=(\beta_1, \beta_2, \beta_3)$. Folgende Werte liegen uns vor:
\[ (\boldsymbol{X}'\boldsymbol{X})^{-1} = \left( \begin{array}{ccc} 0.38 &
0.12 & 0.08\\ 0.12 & 0.08 & 0.02\\ 0.08 & 0.02 & 0.03
\end{array} \right),\ \widehat{\boldsymbol{\beta}} = \left( \begin{array}{c}
0.12\\-0.88\\0.32
\end{array} \right),\]  \[\frac{1}{27} \sum_{i=1}^{30} \widehat \varepsilon_i^2 =0.56 , \ \sum_{i=1}^{30} (y_i-\overline y)^2=53.02 \, , \ R^2 = 0.715 \, .
\]


8.1$\quad$Getestet werden soll die Nullhypothese $H_0$: $\beta_2= - 1$. Bestimmen Sie dazu die $T$-Statistik.  \[ \fbox{a} \ (\hat \beta_2 + 1)  \quad \fbox{b} \ (\hat \beta_2 - 1) \quad \fbox{c} \ \sqrt{0.08} \quad \fbox{d} \ \frac{1}{\sqrt{0.56}\sqrt{0.08}}  \quad \fbox{e} \ \frac{1}{27} \sum_{i=1}^{30} \widehat \varepsilon_i^2 \quad \fbox{f} \ \sqrt{30 \sum_{i=1}^{30} (y_i-\overline y)^2} \]

Die $T$-Statistik ist gegeben durch   

Hinweis: Abschnitt 12.4.



8.2
$\quad$Getestet werden soll die Nullhypothese $H_0$: $\beta_2=\beta_3=0$. Bestimmen Sie dazu die $F$-Statistik.  \[ \fbox{a} \ \frac{R^2}{1-R^2}  \quad \fbox{b} \ \frac{R^2}{(1-R)^2} \quad \fbox{c} \ \frac{R}{1-R} \quad \fbox{d} \ \frac{30-3}{2}  \quad \fbox{e} \ \frac{30}{3}\quad \fbox{f} \ \frac{3-1}{30-3} \]

Die $F$-Statistik ist gegeben durch   

Hinweis: Abschnitt 12.4.





zur Startseite