24
数理統計講義資料 確率論の基礎 多次元の確率変数・確率分布

数理統計講義資料 確率論の基礎hchigira/st1611.pdf · 次元確率変数(個の確率変数) だけで経済データを扱えるか 例 所得の調査 宮城県民の所得の母集団分布

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

数理統計講義資料��

確率論の基礎��

���多次元の確率変数・確率分布���

� ���� �

� はじめに�次元確率変数(�個の確率変数)�だけで経済データを扱えるか�

例�� 所得の調査宮城県民の所得の母集団分布� �����(�次元確率変数)

� 平均所得を調べるため、�人にアンケート

� ��� � �� � � � � �で�次元確率変数

例� 所得と消費の調査宮城県民の所得�と消費� の母集団分布(次元確率変数)

� �と� の関係を調べるため、�人にアンケート

� ���� ���� � �� � � � � �で�次元確率変数

� ���� �

�アンケートデータの扱い確率変数同士の関係性の記述

などのために多次元確率変数を考える

� ���� �

講義の構成� 離散な多次元確率変数

�� 連続な多次元確率変数

�� 独立で同一分布な多次元確率変数� ���� �

� 離散な多次元確率変数

❏ 同時確率関数

つの離散確率変数�、� を考える

������

�� ��� ���

� �� �

同時確率関数(����� ����������� ��������� ���)�

�� �� � ��(�が�をとり、かつ� が�をとる確率)

� ���� �

Æ ���の性質� �� �� � �� � �� ��� �

��

�� �� � �� �

Æ �次元確率変数の���

��� ��� � � � � �� ���となり、� ��� ��� � � � � �� ��� � �� ���� � � � � ���

��� � ��

�� ��� ��� � � � ��� ��� �

� ���� �

❏ 周辺確率関数�つの確率変数�(または�)だけに着目したい

������

� �� ��

� ��� ��� ���

� �� � ��

�� �� ��� ���

周辺確率関数(�������� ����������� ��������� ���)������������

�� �� �

� �� �� � ��

(� に関わらず、�が�をとる確率)

�� �� �

� �� �� � ��(�に関わらず、� が�をとる確率)

� ��� �

Æ ���の性質� �� �� � �� ��、 �� �� � �� ��

�� �� �、

��

�� �� �

Æ �次元確率変数の��������

��の���� ��� ��� �

��� � ��

�� ��� ��� � � � � �� ���

�����の���� ��� ��� �

��� � ��

����

��� ��� � � � � �� ���

� ��� �

❏ 条件付き確率関数�が� に応じてどう変わる(または� が�に応じてどう変わる)�

� ���� �����! � �

���

���

���

���

� ��

����

���� ���� �"

����! �

��

����

����

� ��

���

� �

��

条件付き確率関数(��� ������� ����������� ��������� ���)����������������

�� ��� �� � ���������

� �����

(� が�をとった時に、�が�をとる確率)

�� ��� �� � ���������

� �����

(�が�をとった時に、� が�をとる確率)

� ���� �

Æ ���の性質� �� ��� �� � �� ��� �、 �� ��� �� � �� ��� �

�� ��� �� �� ��、

��

�� ��� �� �� ��

Æ �次元確率変数の����������

��の���� ��� ����� ��� � � � ��� ��� ��� ��� � � � ��� ���

��� ��� � � � ��� ���

�����の���� ��� ����� ��� � � � ����� �����

��� ��� � � � ��� ���

��� ��� � � ����� �����

� ���� �

❏ 独立性�と� が無関係なことを表す

�と� が独立� �� �� � �� �� �� �� ��

� �� ��� �� �� ��

� �� ��� �� �� ��

Æ �次元確率変数の独立性

��� � � � � ��は互いに独立 � ��� ��� � � � ��� ��� ��

��� ��� ���

� ����� �

❏ 同一分布性�と� の���が同じなら�と� は同一分布

Æ �次元確率変数の同一分布性

��� � � � � ��の���が同じなら��� � � � � ��は同一分布

❏ 独立かつ同一分布

��� � � � ��� は互いに独立で同一分布(�� !�!� !�� ��

� !�������� �#������! � ���)

��������� �� � ���� � �� � � � � �

� ����� �

❏ 実例

日本全国の$$�%�世帯の居住地と、現居住のタイプ�� �� 人口$万人以上の市、� �� それ以外の都市と町村

� �� 持ち家、� �� 持ち家ではない分割表�

������

� � 計� ��$& �� � ���%

� ����� �$& ��&�

計 ���&� �$��% $$�%�

総務省『全国消費実態調査』(����年)より作成

便宜上、この$$�%�世帯を母集団と考えて各種の母集団分布を計算してみる(本当の母集団は日本全国の全世帯で約

����万世帯)

� ����� �

���と����(先の表のセルにある値を$$�%�で割る)

����

��

� � �� ��

� ��$�� ���$ ��&&�

� ���%� ����& ���

�� �� ��&% ��& �

�����

都市部に住みかつ持ち家� �� �� � �� �$��

住む場所に関わらず持ち家� �� �� �&%

家のタイプに関わらず都市部に住む� �� �� �&&�

といったことが解る

ここで、明らかに �� �� � �� �� �� �� ��

なので�と� は独立ではない。居住地と家のタイプには関係があるので���を計算してみる

� ����� �

����

������

� �

���� �"

����! �

�$��

�&&� � �%

��$

�&&� ���

��%�

�� �%��

���&

�� �� �

都市部の持ち家率 �� ��� �� は町村部の持ち家

率 �� ��� �� より低い

ちなみに、 �� ��� �� ��������

������� �����

����。つまり、

母集団を都市部に住む人に限定した際の持ち家率と考えられる

� ����� �

� 連続な多次元確率変数

❏ 同時確率密度関数

つの連続確率変数�、� を考える同時確率密度関数(����� ����������� !�#��� ��������� �� �)�

���� ��� ��(�が�をとり、かつ� が�をとる確率密度)

Æ �� �の性質

� ���� ��� �� � �� ��� �

���� ��� ������ �

Æ �次元確率変数の�� �

������� ������� � � � � ���

� ����� �

❏ 周辺確率密度関数�つの確率変数�(または�)だけに着目したい

周辺確率関数(�������� ����������� !�#��� ��������� �� �)�������

���� ��� ����(� に関わらず、�が�をとる確率密度)

�� ���

���� ��� ����(�に関わらず、� が�をとる確率密度)

Æ �次元確率変数の�� ������

��の�� �� �������

� � �

������� ������� � � � � ������ � � � ���

�����の�� �� �������

� � �

������� ������� � � � � �������� � � � ���

� ���� �

❏ 条件付き確率密度関数�が� に応じてどう変わる(または� が�に応じてどう変わる)�

条件付き確率密度関数(��� ������� ����������� !�#��� ������������

���� ����� ��� �����

� ���

(� が�をとった時に、�が�をとる確率密度)

�� ������� ��� �����

����

(�が�をとった時に、� が�をとる確率密度)

Æ �次元確率変数の�� ����������

��の�� �� ���������� ���������� � � � � ��� ������ ���������� ����

������ ���������� ����

�����の�� �� ���������� ������������ � � � � �����

������ ���������� ����

������ �����������������

� ���� �

❏ 独立性�と� が無関係なことを表す

�と� が独立 � ���� ��� �� ������� ���

� ���� ����� �����

� �� ������� �� ���

Æ �次元確率変数の独立性

��� � � � � ��は互いに独立 � ������� ������� � � � � ��� ��

��� �������

� ����� �

❏ 同一分布性�と� の�� �が同じなら�と� は同一分布

Æ �次元確率変数の同一分布性

��� � � � � ��の�� �が同じなら��� � � � ���は同一分布

❏ 独立かつ同一分布

��� � � � ��� は互いに独立で同一分布(�� !�!� !�� ��

� !�������� �#������! � ���)

��������� �� � ���� � �� � � � � �

� ����� �

� 独立で同一分布な多次元確率変数

アンケートデータ等に関して、

�� � ���� � �� � � � � �

という仮定を置くことが非常に多い(もしくは���となるようにアンケート等を取る)

❏ 数学的な計算の簡単化

�次元確率変数��� � �� � � � � �

��次元��� � ��� ��� � � � ��� ���

�次元�� � � ������� ������� � � � � ���

�が大きいと計算が大変

� ����� �

�� � ���� � �� � � � � �を仮定

���������������

��� ��� � � � ��� ���

独立

����� ��� ���

同一分布

�� ���

������� ������� � � � � ���

独立

����� �������

同一分布

������

��次元��� � ��� ��� � � � ��� ���

�次元�� � � ������� ������� � � � � ���

が��次元�� � �� ��

�次元� � � �����

になり、計算が大幅に簡単化

� ����� �

❏ 偏りの無いデータ���となるようアンケートを取ると、一般に偏りの無いデータ

が得られる

例� 講義の成績履修者���人の母集団分布�

�� �� ��� �� � ��� �� �� ���� �� �� �� �� $� ��

平均成績を調べるため、人にアンケートを取る

�人目を���人から無作為に選ぶ。�� � ���。�人目は

'さん(成績は�)になった

人目も、�人目が'さんだったこととは無関係に、���人から無作為に選ぶ。�� � ���。人目は(さん(成績は�)になった

� ����� �

この時は�� � ��� ���� � �� 。平均成績��$は

���� ��&に近い

例(続き)� 講義の成績先ほどの例で、人目を'さんの友人��人の中から無作為に選ぶとする

�����

��� �� �� ���� さん� �

��� ���� さん� ��

��� $��� さん� �

で、人目は)さん(成績は$)になった

この時は�� � ��� ���� � �� ではない。 ����

�� さん�は ���とは大きく異なり、平均成績��$

は���� ��&から遠い

� ����� �