W tym artykule omówimy wariancję warunkową i przewidywania wykorzystujące warunkowe oczekiwanie dla różnego rodzaju zmiennej losowej z kilkoma przykładami.
Warunkowa wariancja
Warunkową wariancję zmiennej losowej X przy danej Y definiuje się podobnie jak warunkowe Oczekiwanie zmiennej losowej X przy danej Y jako
(X|Y)=E[(XE[X|Y])2|T]
tutaj wariancja jest warunkowym oczekiwaniem różnicy między zmienną losową a kwadratem warunkowego oczekiwania X przy danej Y, gdy podana jest wartość Y.
Związek między warunkowa wariancja i warunkowe oczekiwanie is
(X|Y) = E[X2|Y] – (E[X|Y])2
E[(X|Y)] = E[E[X2|Y]] – E[(E[X|Y])2]
= EX[X2] – E[(E[X\Y])2]
ponieważ E[E[X|Y]] = E[X], mamy
(E[X|Y]) = E[(E[X|Y])2] - (E [X])2
jest to nieco podobne do relacji bezwarunkowej wariancji i oczekiwania, która była
Var (X) = E [X2] - (E [X])2
i możemy znaleźć wariancję za pomocą warunkowej wariancji jako
zmienna(X) = E[zmienna(X|Y] + zmienna(E[X|Y])
Przykład warunkowej wariancji
Znajdź średnią i wariancję liczby podróżnych, którzy wsiadają do autobusu, jeśli ludzie przybyli na zajezdnię autobusową mają rozkład Poissona ze średnią λt i początkowy autobus przyjeżdżający do zajezdni jest równomiernie rozłożony w przedziale (0,T) niezależnie od ludzi przybył czy nie.
Rozwiązanie:
Aby znaleźć średnią i wariancję, niech dla dowolnego czasu t , Y jest zmienną losową dla czasu przybycia autobusu, a N(t) jest liczbą przylotów
E[N(t)|Y = t] = E[N(t)|Y = t]
przez niezależność Y i N(t)
=λt
ponieważ N(t) to Poisson ze średnią \lambda t
Stąd
E[N(T)|Y]=λY
więc branie oczekiwań daje
E[N(T)] = λE[T] = λT/2
Aby otrzymać Var(N(Y)), używamy wzoru na warunkową wariancję

a zatem
(N(T)|T) = λY
E[N(T)|Y] = λY
Stąd z formuły warunkowej wariancji
Var(N(Y)) = E[λT]+(λY)
=λT/2 + λ2T2/ 12
gdzie wykorzystaliśmy fakt, że Var(Y)=T2 / 12.
Wariancja sumy losowej liczby zmiennych losowych
rozważ kolejność niezależnych i identycznie dystrybuowane zmienne losowe X1,X2,X3,………. i inną zmienną losową N niezależną od tego ciągu, znajdziemy wariancja sumy tej sekwencji jako

za pomocą

co jest oczywiste przy definicji wariancji i warunkowej wariancji dla indywidualnej zmiennej losowej do sumy ciągu zmiennych losowych stąd

Przepowiednia
W predykcji wartość jednej zmiennej losowej można przewidzieć na podstawie obserwacji innej zmiennej losowej, do predykcji zmiennej losowej Y jeśli obserwowana zmienna losowa to X używamy g(X) jako funkcji, która mówi o przewidywanej wartości, oczywiście spróbuj wybrać g(X) zamknięte do Y w tym celu najlepiej g to g(X)=E(Y|X) w tym celu musimy zminimalizować wartość g używając nierówności

Ta nierówność, którą możemy uzyskać jako

Jednak przy danym X, E[Y|X]-g(X), będące funkcją X, można traktować jako stałą. A zatem,

co daje wymaganą nierówność

Przykłady dotyczące przewidywania
1. Zaobserwowano, że wzrost osoby wynosi sześć stóp, jaka byłaby prognoza wzrostu jego syna po dorosłości, gdyby wzrost syna, który wynosi teraz x cali, ma rozkład normalny ze średnią x+1 i wariancją 4.
Rozwiązanie: niech X będzie zmienną losową oznaczającą wzrost osoby, a Y zmienną losową wzrostu syna, to zmienna losowa Y jest
Y=X+e+1
tutaj e reprezentują normalną zmienną losową niezależną od zmiennej losowej X ze średnią zerową i wariancją cztery.
więc prognoza dotycząca wzrostu synów to

więc wzrost syna będzie wynosił 73 cale po wzroście.
2. Rozważmy przykład wysyłania sygnałów z lokalizacji A i lokalizacji B, jeśli z lokalizacji A wysyłana jest wartość sygnału s, która w lokalizacji B została odebrana przez rozkład normalny ze średnią s i wariancją 1, natomiast jeśli sygnał S wysłany w lokalizacji A ma rozkład normalny przy średniej \mu i wariancji \sigma^2, jak możemy przewidzieć, że wartość sygnału R wysłanego z lokalizacji A zostanie odebrana to r w lokalizacji B?
Rozwiązanie: Wartości sygnału S i R oznaczają tutaj zmienne losowe o normalnym rozkładzie, najpierw znajdujemy funkcję gęstości warunkowej S przy danym R jako

to K jest niezależne od S, teraz

tutaj też C1 i C2 są niezależne od S, więc wartość funkcji gęstości warunkowej wynosi

C jest również niezależny od s, więc sygnał wysłany z lokalizacji A jako R i odebrany w lokalizacji B jako r jest normalny ze średnią i wariancją

a błąd średniokwadratowy dla tej sytuacji wynosi

Predyktor liniowy
Za każdym razem, gdy nie możemy znaleźć funkcji gęstości prawdopodobieństwa łącznego, znana jest nawet średnia, wariancja i korelacja między dwiema zmiennymi losowymi, w takiej sytuacji bardzo pomocny jest predyktor liniowy jednej zmiennej losowej względem innej zmiennej losowej, który może przewidzieć minimum , więc dla predyktora liniowego zmiennej losowej Y względem zmiennej losowej X bierzemy a i b, aby zminimalizować

Teraz rozróżnijmy częściowo względem a i b otrzymamy

rozwiązując te dwa równania dla a i b otrzymamy

w ten sposób minimalizacja tego oczekiwania daje predyktor liniowy jako

gdzie średnie są odpowiednimi średnimi zmiennych losowych X i Y, błąd predyktora liniowego będzie otrzymany z oczekiwaniem

Ten błąd będzie bliższy zeru, jeśli korelacja jest doskonale dodatnia lub doskonale ujemna, czyli współczynnik korelacji wynosi +1 lub -1.
Wnioski
Omówiono wariancję warunkową dla dyskretnej i ciągłej zmiennej losowej z różnymi przykładami, jedno z ważnych zastosowań warunkowego oczekiwania w przewidywaniu jest również wyjaśnione za pomocą odpowiednich przykładów i z najlepszym predyktorem liniowym, jeśli potrzebujesz dalszej lektury, przejdź do poniższych linków.
Więcej informacji na temat matematyki można znaleźć w naszym Strona Matematyka
Pierwszy kurs prawdopodobieństwa Sheldona Rossa
Zarysy prawdopodobieństwa i statystyki Schauma
Wprowadzenie do prawdopodobieństwa i statystyki autorstwa ROHATGI i SALEH