計測工学基礎
2019.07.03
授業の後半で確認テストを実施します.窓側の席は柱の部分を避けて座って準備してください.
まず,よくわからないのが,下の図のようなグラフを作成した人がそこそこいたことです.分散分析は3個以上の平均値の比較なので,平均値のグラフが必要です.
次に,分散分析では個々の平均値のどの間に有意差があるのかはわかりません.それをするのは本日の多重比較です.なので,以下のようなグラフを描いている人もいたのですが,これは間違っています.
今回の危険率 p は2.22186494938984E-11という値になったはずです.この表記はプログラミングや表計算においてはよく用いられる表現で,2.221×10-11という意味です.これがわかっていないので,値の表記が結論の部分で変になっている人もいました.また,レポートはワープロソフトで作成しているので,きちんと上付きの表現に文中では直してください.すなわち,以下のようにきちんと表記してください.
p = 2.221×10-11
最後に, p の値がこんなに小さいのに,結論が有意差なしになっている人がいました.検定の意味をちゃんと理解してください.
解答例
検定結果
グラフ
結論
図に示す各平均値の間には有意な差がある(F1454 = 16.87, p <.001)
資料を参考に予習してください.
分散分析によって,データの平均値の間に有意な差が検出されたとしても,どのデータの間に有意な差があるのかはわかりません.そのため,各群の平均値の間の有意差を具体的に検討する手法として多重比較があります.今回はその中でもテューキー法と呼ばれる方法を実際に試してみます.ただし,これまでと異なり,表計算ソフトにはそれ用の関数は用意されていません.原理に即して手作業で行うことになります.
多重比較を行う手法はいくつも提案されています.その中で,この授業では検出力が高く,かつ,バランスが取れているとして定評のあるテューキー法について実際に作業してみます.なお,厳密には各群のデータの個数が同じ場合をテューキー法と言い,群のデータの個数が異なる場合にはテューキー-クラマー法と言いますが,まとめてテューキー法と呼ばれることも多いです.
テューキー法で必要になるのは分散分析でも使用した群内平方和から求める分散 VW とステューデント化された範囲の表より得る q です.それらについて順に説明します.
分散分析を行うと得られる分散分析表の「平均平方」とある内の「グループ内」の方です.各群の中でのデータのばらつきを表します.
この値は独自に求めることも可能ですが,多重比較を行う前に分散分析を行っておけば簡単に求められますので,せっかくですからそのようにしましょう.
添付の表です.これは次に説明する臨界差を出すために使用されます.通常の表計算ソフトではこれに関する関数は用意されていません.専用の統計解析ソフト(例えばRなど)を用いれば標準で入っています.
既存の表を使用しますので,危険率pの値を計算することができません.あらかじめ想定する検定の水準(αが.05もしくは.01)に対応した部分を見て行います.また,表は群の数と自由度でqの値を探すことになっています.自由度は群内の自由度ですので,分散分析表の自由度のグループ内の方です.
次に臨界差を VW と q から計算します.求め方は資料の式(4)もしくは(5)です.各群のデータの個数が等しい場合には式(4)を,異なる場合には式(5)を使用してください.
ここで,データの個数 ni と nj ですが,各群の平均値の差についてそれぞれ議論しますからグループAとグループBの平均値の間の差を議論する場合には ni と nj はそれぞれの群のデータの個数となります.
添付の表を使用して実習しましょう.表はA〜Dまでの群の測定値が入っています.これらの群の平均値について多重比較を行い,有意な差が存在するかを確認します.
まずは分散分析によりデータの解析を行いましょう.結果としては危険率 p は.011となり,有意な差があることは確認されるでしょう.
臨界差についての議論は各平均値間で総当りで行います.混乱してしまいそうなので,まずは,平均値とそれらの差についての表を作ります.表を作成するときには群を平均値の小さい順に並べ直して,作成します.そうすれば,一番右上のセルが最も大きな差となり,そこから有意差の検討を始めれば良いからです.そこに差がなければおそらくどの平均値間にも有意差は出ないでしょう.
今回のデータを使用すると,以下のような表になるはずです.
それぞれの群の間の差を総当りで計算しますが,差は表の右上半分だけで構いません.正の値のところだけです.
今回は各データ群のデータの個数に違いがありますので,式(5)を使うことになります.ステューデント化された範囲の表から q を探しますが,分散分析における p が.011だったので,α=.05の方だけで十分でしょう.群の数は4,自由度は33ですので,そこから求めると q =4.00となるはずです.
それぞれのデータの個数を考慮して表を作成すると次のようになるはずです.
差の表と臨界差の表を見比べてどちらが大きいかを見ます.目で見比べるのは大変でしょうから,関数を使用しましょう.表のそれぞれの位置に対応する場所に次のような if() 関数を入れてみます.
もちろんセルの番地は自分の表に合わせてください.これにより,差の方が大きい場合には1が,そうでない場合には0が表示されます.
テューキー-クラマー法による多重比較によって,A群とC群の平均値の間に,また,C群とD群の平均値の間にそれぞれ有意差があることが示された.( p < .05)
今回の多重比較の結果は下のようなグラフにまとめられます.
群BとAやDとの間に差がないのは,群Bの分散が大きいためだということが,エラーバー付きのグラフにするとよくわかります.
リンク先の資料で多重比較を行って,有意差の議論をするとともに,グラフの作成を行いましょう.
次回は二元配置分散分析について学習します.予習用の資料を参考に予習してください.
いつものレポート提出システムを利用して行います.
宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは授業前日火曜日の13:00までです.よろしくお願いします.
=IF(E14>E33,1,0)
Back