計測工学基礎
2019.07.17
授業の後半で確認テストを行いますので,窓側の席では柱の部分を避けて座ってください.
残念ながらまた番号と名前を書いていない人がいました.解答の際には落ち着いて,まずは自分の番号と名前を入力してからということにして下さい.
番号と名前無し: b1803
今回一番気になった点は分散分析表でした.PDF資料のp.3表3に示すのが分散分析表です.それを今回の条件に直すと,以下のようになるはずです.
一番右端の危険率は無理に載せなくても,計算していれば大丈夫です.
また, p の値が間違っている,解釈が間違っているなどの間違いも少し見られました.資料をしっかり読んで理解して下さい.また,わからなければ質問して下さい.
他には,相変わらず p = 3.69E-08 のような表現が見られましたし,不偏分散比については FAのような表現も見られました. F については,下付きで分母の自由度,上付きで分子の自由度を書くのが基本です.以後は気をつけて下さい.
二元配置分散分析について学習しました.残差の求め方がややこしいので注意して下さい.また,分散分析表や結論の表現の部分もややこしいので,前回のWebテキストをしっかり見なおして下さい.
資料を参考に予習してください.
χ 2 検定について学習します.
Calc では標準で用意されている chitest() などの関数は「独立性検定」となっていますが,適合度検定はこの関数を使用して簡単にできます.
教室のCにおける乱数の発生が均等かどうかの検定を行ってみましょう.まず,以下のプログラムで36回サイコロを振った時の出た目の頻度を見てみます.
試しに行ってみたところ,私の手元では以下のようになりました.
Calc の方に,データを写しますが,確率的には各目は6回ずつ出るはずですので,下の図のようにデータを用意します.
使用するのは chitest() 関数です.引数仕様は,実測値,期待値の順ですので,それぞれ実測と期待値のセルを選択します.今回の場合だと,結果を危険率 p で返してくれます.この場合は, p = 0.066 となるはずです.
随分と目に偏りがあるような気もしますが,今回の結果はサイコロの目はそれぞれ1/6の確率で出るという帰無仮説を否定する危険率が .05 を超えていますので,棄却できないことになります.つまり,出た目の割合は有意に偏っているとは言えない,という結論です.
独立性検定とは,個々のデータが独立であるか,依存関係にあるかを検定で確認します.独立とはお互いに影響しあわないことで,座標軸の xyz はそれぞれ独立であるとか,よく聞くはずです.数学的には,「直交している」とも言います.
プラシーボ(偽薬)効果というものがあります.薬理作用が無いにもかかわらず治療薬だとして与えられると患者の症状が良くなる場合があることです.そのため,新薬の開発ではその薬が本当に効果があったのかについて薬理作用の無い物質を投与した場合との効能の違いを見ることが行われます.リンク先の資料の表1および表2のように,新薬と偽薬を投与して改善した人数と変わらなかった人数が出たとすると,この新薬には効果があると言えるかを,それぞれのデータについて独立性検定の観点で議論して下さい.
表1では実際に新薬を飲んで改善した人,しなかった人の行と,偽薬を飲んだのに回復した人としなかった人の行,それから,改善と変化なしの合計が入力されています.独立性検定の作業は,各欄の実測値から期待値を引いたものの2乗を期待値で割ったものの合計である χ2 を求めることです.
期待値は,あるセルを考えた時,その行の合計とその列の合計を掛けあわせ,全体の合計で割ったものになります.
上の表であれば,例えば,新薬の改善(左上)であれば, 143×91➗178 で求められます.表計算ソフトなので,次のようにすればドラッグで他のセルの計算もできます.
= B$4*$D2/$D$4
もちろんセルの記号と数字はそれぞれの環境で異なりますので,自分のセルに合わせて下さい.では,各セルについて期待値を求めましょう.
これでchitest() 関数を使用する準備ができました.どこかのセルで使用して下さい.実測値と期待値はそれぞれ自分が用意したセルを選択します.そうすると,危険率 p が計算されます.今の場合は, 0.065 ということで,それぞれのデータは独立である,という結論になります.実際の意味としては,今回の新薬の効果は有意ではなかったということです.
ちょっと数値が変わった表2についても検定を行ってみましょう.
χ2検定(独立性検定)で危険率 p <.05 となると,各データは独立ではないということになります.では,どのデータが依存関係にあるのかを知るために行うのが残差分析です.以下の式で残差を求めていきます.
χ2は以下の式で与えられるものでした.
一方,今回求める残差は以下の式になります.
ここで,変数 ri は行の合計, cj は列の合計, n は総計です.
リンク先のデータを利用して,実際に残差分析を試してみましょう.このデータはあるページを参考にしたもので,とあるアンケートについて男性と女性の意見分布に偏りがあるかを調べるものです.
各セルの期待値を計算します.資料の式(3)です.
χ2を求めて,独立性の確認をします.
各セルの残差を計算します.資料の式(4)です.この残差は正式には「調整済み残差」と言います.
正規分布に従う仮定では標準正規分布に直した絶対値が1.96を超えると,有意な依存性があるとされます.このとき,水準は5%です.さらに,絶対値が2.58を超えると,1%の水準で依存性があることになります.標準正規分布表で両側0.005%ずつになる点が2.58になるからです.
今回の結論はどうなったでしょうか?
いつものレポート提出システムを利用して行います.
宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは7月23日の13:00までです.よろしくお願いします.
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
int main(void)
{
srand((unsigned) time(NULL));
int i, d, dice[6];
for(i=0; i<=5; i++)
{
dice[i] = 0;
}
for(i=1; i<=36; i++)
{
d = rand() % 6;
dice[d]++;
}
for(i=1; i<=6; i++)
{
printf("%2d ", i);
}
printf("\n");
for(i=0; i<=5; i++)
{
printf("%2d ", dice[i]);
}
printf("\n");
return 0;
}
1 2 3 4 5 6
4 12 5 2 8 5
「独立である」とは,データの間に関連は無い,ということです.独立性検定の場合には帰無仮説としては,「独立である(関連はない)」となり,対立仮説が「独立でない(関連性がある)」となるので,ちょっとややこしくなります.
Back