Kapitel 2$\quad$Beschreibende Methoden univariater Datenanalyse

Aufgabe 1$\quad$Von Studierenden wird das Alter $X$ in Jahren und das Geschlecht $Y$ (m/w/d) beobachtet.

1.1$\quad$Geben Sie alle richtigen Behauptungen an. Das Merkmal $X$ ist

\[\fbox{a} \ \mbox{ordinal} \quad  \fbox{b}\  \mbox{stetig}  \quad \fbox{c} \ \mbox{metrisch} \quad \fbox{d} \ \mbox{diskret} \quad \fbox{e} \ \mbox{nominal} \quad \fbox{f} \ \mbox{negativ} \]

Folgende Behauptungen sind richtig

Hinweis: Abschnitt 2.1.


1.2$\quad$Geben Sie alle richtigen Behauptungen an. Das Merkmal $Y$ ist

\[\fbox{a} \ \mbox{ordinal} \quad  \fbox{b}\  \mbox{stetig}  \quad \fbox{c} \ \mbox{metrisch} \quad \fbox{d} \ \mbox{diskret} \quad \fbox{e} \ \mbox{nominal} \quad \fbox{f} \ \mbox{ungleich } 0 \]

Folgende Behauptungen sind richtig

Hinweis: Abschnitt 2.1.


Aufgabe 2$\quad$Geben Sie alle falschen Behauptungen an. Die Summe $\sum_{i=1}^{10} i$  ist gleich

\[\fbox{a} \ \sum_{k=1}^{10} i \quad  \fbox{b}\  \sum_{i=1}^{5} i  + \sum_{i=5}^{10} i \quad \fbox{c} \ \sum_{k=1}^{10} k \quad \fbox{d} \ \sum_{i=0}^{10} i \quad \fbox{e} \ 55 \quad \fbox{f} \ 50 \]

Folgende Behauptungen sind falsch

Hinweis: Abschnitt 2.2.1.



Aufgabe 3
$\quad$Das Merkmal $X$ messe, wie oft eine Person pro Woche mit dem Rad zur Arbeit fährt. Die möglichen Ausprägungen sind $a_1=0$, $a_2=1$, ..., $a_6=5$. Mit $\widehat{F}$ wird die empirische Verteilungsfunktion aus einer Stichprobe bezeichnet, $\widehat{F} (a_j) = h_1 + \cdots + h_j$. Gesucht ist die relative Häufigkeit der Leute, die mindestens einmal pro Woche mit dem Rad zur Arbeit fahren.

\[\fbox{a} \ \widehat{F} (5) \quad  \fbox{b}\  - \widehat{F} (4) \quad \fbox{c} \ - \widehat{F} (3) \quad \fbox{d} \ - \widehat{F} (2) \quad \fbox{e} \ - \widehat{F} (1) \quad \fbox{f} \ - \widehat{F} (0) \]

Die gesuchte relative Häufigkeit beträgt  .

Hinweis: Abschnitt 2.2.1.



Aufgabe 4$\quad$Das stetige Merkmal $X$ sei in 5 Klassen eingeteilt:

\[ (0, 10], \quad (10, 20], \quad (20, 30], \quad (30, 40], \quad (40, 50] \, . \]

Mit $\widehat{f}$ und $\widehat{F}$ bezeichnen wir die empirische Dichtefunktion und die empirische Verteilungsfunktion. Gesucht ist ein Ausdruck für $\widehat{F} (28)$.

\[\fbox{a} \ \widehat{F} (30) +  \quad  \fbox{b}\  8 \, \widehat{f} (30)  \quad \fbox{c} \  \widehat{F} (20) +  \quad \fbox{d} \ 8 \, \widehat{f} (20) \quad \fbox{e} \  \widehat{f} (30) \quad \fbox{f} \ 2 \, \widehat{f} (30) \]

$\widehat{F} (28)$ ist gleich  .

Hinweis: Abschnitt 2.2.2.


Aufgabe 5$\quad$Das diskrete Merkmal $X$ habe $k$ mögliche Ausprägungen, $a_1$, ..., $a_k$, die mit den absoluten Häufigkeiten $n_1$, ..., $n_k$ angenommen werden. Der Stichprobenumfang ist gleich $n$, $n > k$. Gesucht ist ein Ausdruck für das arithmetische Mittel, $\overline x$.

\[\fbox{a} \ \sum_{i=1}^n a_i n_i  \quad  \fbox{b}\  \sum_{i=1}^n a_i   \quad \fbox{c} \  \frac{1}{\sum_{j=1}^k a_j}  \quad \fbox{d} \ \frac{1}{k} \quad \fbox{e} \  \frac{1}{\sum_{j=1}^k n_j} \quad \fbox{f} \ \sum_{j=1}^k a_j n_j  \]

Das arithmetische Mittel ist gleich  .

Hinweis: Abschnitt 2.3.1.


Aufgabe 6$\quad$Es liegen $n$ historische Preisdaten $x_1$, ..., $x_n$ in DM (Deutsche Mark) mit dem arithmetischen Mittel $\overline x$ vor. Dieselben Beobachtungen werden jetzt als $y_1$, ..., $y_n$ in Euro ausgedrückt. Vereinfachend dürfen Sie davon ausgehen, dass zwei DM in einen Euro getauscht wurden. Wie groß ist dann das arithmetische Mittel $\overline y$?

\[\fbox{a} \ \sum_{i=1}^n x_i  \quad  \fbox{b}\  \overline x   \quad \fbox{c} \  2  \quad \fbox{d} \ \frac{1}{2} \quad \fbox{e} \  \frac{1}{\sqrt{2}} \quad \fbox{f} \ 4  \]

$\overline y$ ist gleich  .

Hinweis: Abschnitt 2.3.1.

Aufgabe 7$\quad$Das stetige Merkmal $X$ sei in 5 Klassen eingeteilt:

\[ (0, 10], \quad (10, 20], \quad (20, 30], \quad (30, 40], \quad (40, 50] \, . \]

Mit $\widehat{f}$ und $\widehat{F}$ bezeichnen wir die empirische Dichtefunktion und die empirische Verteilungsfunktion. An den Klassenobergrenzen gelte $\widehat{F} (10)= 0.15$, $\widehat{F} (20)= 0.30$,  $\widehat{F} (30)= 0.55$,  $\widehat{F} (40)= 0.75$,  $\widehat{F} (50)= 1$. Wie lautet der Median, $x_{0.5}$?


\[\fbox{a} \ \widehat{F} (20) +  \quad  \fbox{b}\  0.5  \quad \fbox{c} \  (0.5 - 0.3)  \quad \fbox{d} \ 20 + \quad \fbox{e} \  \frac{1}{\widehat{f} (30)} \quad \fbox{f} \  \widehat{f} (30) \]

Der Median ist gleich  .

Hinweis: Abschnitt 2.3.1.


Aufgabe 8$\quad$Gegeben ist folgende geordnete Stichprobe:

\[ 3 \, , \  5 \, , \ 7 \, , \ 11 \, , \ 13 \, , \ 17 \, , \ 19 \, , \ 23 \, , \ 29 \, , \ 31  \, .\]

Geben Sie alle richtigen Behauptungen an für den Median $x_{0.5}$ und die Quartile $x_{0.25}$ und $x_{0.75}$ an. 

\[\fbox{a} \ x_{0.5}=13 \quad  \fbox{b}\   x_{0.5}=15  \quad \fbox{c} \  x_{0.5}=17 \quad \fbox{d} \  x_{0.25}=7 \quad \fbox{e} \  x_{0.25}=11 \quad \fbox{f} \  x_{0.75}=25 \]

Folgende Behauptungen sind richtig

Hinweis: Abschnitt 2.3.1.


Aufgabe 9$\quad$Aus einer Stichprobe vom Umfang $n=100$ ergibt sich:

\[ \sum_{i=1}^{100} x_i = 1500 \quad \mbox{und} \quad  \sum_{i=1}^{100} x_i^2 = 35000.\]

Berechnen Sie die mittlere quadratische Abweichung $d_x^2$.


\[\fbox{a} \ 3500 \quad  \fbox{b}\   - 1500  \quad \fbox{c} \  35000 \quad \fbox{d} \  -15 \quad \fbox{e} \  \frac{1}{100} \quad \fbox{f} \ -225 \]

Die mittlere quadratische Abweichung ist gleich 

Hinweis: Abschnitt 2.3.2.


Aufgabe 10$\quad$Das stetige Merkmal $X$ sei in $k$ Klassen eingeteilt:

\[ (a_0^*, a_0^*], \quad (a_1^*, a_2^*], \, \ldots, \ (a_{k-1}^*, a_k^*] \, . \]

Gegeben seien die absoluten bzw. relativen Häufigkeiten, $n_1$, ..., $n_k$ bzw. $h_1$, ..., $h_k$ und das arithmetische Mittel  $\overline x$. Wie lautet ein approximativer Ausdruck für die mittlere quadratische Abweichung $d_x^2$? Geben Sie alle richtigen Approximationen für $d_x^2$ an.

\[\fbox{a} \ \sum_{j=1}^k \left(\frac{a_{j-1}^*+ a_j^*}{2} - \overline x \right)^2 h_j  \quad  \fbox{b}\  \sum_{j=1}^k \left(\frac{a_{j}^*- a_{j-1}^*}{2} - \overline x \right)^2 h_j   \quad \fbox{c} \  \frac{1}{k} \sum_{j=1}^k \left(\frac{a_{j-1}^*+ a_j^*}{2} - \overline x \right)^2  \]

\[\fbox{d} \ \sum_{j=1}^k \left(a_j^* - \overline x \right)^2 h_j \quad \fbox{e} \ \frac{1}{n} \sum_{j=1}^k \left(\frac{a_{j}^*- a_{j-1}^*}{2} - \overline x \right)^2 n_j \quad \fbox{f} \ \frac{1}{n} \sum_{j=1}^k \left(\frac{a_{j-1}^*+ a_j^*}{2} - \overline x \right)^2 n_j \]

Folgende Approximationen sind richtig.

Hinweis: Abschnitt 2.2.2.



Aufgabe 11$\quad$Es seien $x_{(1)}, ..., x_{(n)}$ die der Größe nach geordneten Umsätze der Filiale Ernesto I, deren (vertikaler) Boxplot sich in der Abbildung links befindet; $y_{(1)}, ..., y_{(m)}$ seien die  der Größe nach geordneten Umsätze der Filiale Ernesto II, deren (vertikaler) Boxplot sich in der Abbildung rechts befindet.

Geben Sie alle falschen Behauptungen an.

$\fbox{a}$  Für die Mediane gilt: $x_{0.5} < y_{0.5}$.
$\fbox{b}$  Für das Maximum von Ernesto I gilt: $x_{(n)} > 1000$.
$\fbox{c}$ Für das Minimum von Ernesto II gilt: $y_{(1)} < 500$.
$\fbox{d}$ Für die oberen Quartile gilt: $x_{0.75} > y_{0.75}$.
$\fbox{e}$ Für die unteren Quartile gilt: $x_{0.25} < y_{0.25}$.
$\fbox{f}$ Ernesto I hat einen kleineren Interquartilsabstand als Ernesto II.

Folgende Behauptungen sind falsch

Hinweis: Abschnitt 2.3.3.


zur Startseite