[ < ] [ globale Übersicht ] [ Kapitelübersicht ] [ Stichwortsuche ] [ > ]


Neue Abstandsdefinitionen

Zur Definition neuer, robuster Abstandsmaße wird oft auf die Komponenten $u_i, v_i \in \R$ der Vektoren $u, v \in \R^n$ zurückgegriffen:

 D(u,v) \,:=\,\sum \limits_{i=1}^{n} d(u_{i},v_{i}).

Wenn man die skalare Abstandsfunktion $d: \R^2 \to \R$ nach der Maximum-Likelihood-Methode (Die Maximum-Likelihood-Methode dient der Ermittlung statistischer Schätzungen $\hat{c}$ für einen Parametervektor c. Bei einer diskreten Wahrscheinlichkeitsverteilung werden z.B. die Parameter so gewät, daß dem Ereignis $\{ c = \hat{c} \}$ die größte Wahrscheinlichkeit zukommt.) bestimmt, so erhält man z.B.

für die Normalverteilung $d(u,v) \,:=\, (u-v)^{2}$ ,
für die zweiseitige Exponentialverteilung $d(u,v) \,:=\, |u - v|$
und für die Cauchy-Verteilung $d(u,v) \,:=\,\log(1+\frac{1}{2}(u-v)^{2})$ .

Auf Huber [241] geht die folgende, von speziellen Verteilungsfunktionen unabhängige Definition einer parametrisierten Abstandsfunktion

\[
   d_{a}(u_{i},v_{i}) := \left\{ \begin{array}{ll}
           (u_{i} - v_{i})^{2}, \quad &  |u_{i} - v_{i}| < a, \\
           a \left(2 |u_{i} - v_{i}| - a \right), \quad &
                                               |u_{i} - v_{i}| \ge a, 
        \end{array}
\right.  \]

zurück, die für $|u_{i} - v_{i}| < a$ quadratisch ist, nach außen mit stetiger erster Ableitung linear fortgesetzt wird, und dementsprechend - abhängig vom Parameter a - große Abweichungen $|u_{i}-v_{i}|$  schwächer gewichtet als die Euklidische Entfernungsdefinition $D_{2}(u,v) = \| u-v\|_2$ .

Außer dem Maximum-Likelihood-Prinzip (das auf die M-estimates führt) werden auch Ordnungsstatistiken (L-estimates) und Rangtests (R-estimates) zur Definition robuster Abstandsmaße verwendet (Huber [242]).


[ < ] [ globale Übersicht ] [ Kapitelübersicht ] [ Stichwortsuche ] [ > ]