計測工学基礎
2019.07.10
残念ながらレポートに学生番号と名前をまずきちんと書く,という習慣がない人がまだいました.解答に際しては,最低限必要なことなので,ここはやはり最初にしっかり確認しましょう.
学生番号と名前無し: b1806 b1811
相変わらず,きちんと各要素が記述されていないグラフも多かったです.下の図はその一例ですが,横軸の説明ができていません.
HSDの算出ですが,群内のデータの個数が全て同じであれば,値は一つになるので,表を作成する必要は無いと,授業中にも説明していました.なのに,下のような表を作る作業で時間を無駄にした人が多かったのも残念です.値が全て同じなので,途中で気づいてくれても良いのにと思いますが.
それからあまり多くはありませんでしたが,下の図のようにエラーバーを適切に挿入できていない人も何人かいました.基礎的な作業ですので,きちんと習得してください.「両方に同じ値」のチェックボックスをクリックするだけです.
学生さんの間の理解度の差がだいぶ目立つようになってきました.図がきちんと作成できるか,検定結果が説明できるか,基本的なところなのでもうちょっと理解を深めてください.
まず,基本的なところとしては,表のキャプション(見出し)は表の上に来ます.一方,図のキャプションは下に来ます.論文等の技術文書での鉄則ですので,学生実験でも指導を受けているはずです.間違えないようにしてください.以下に良くない図や表の例を示しておきます.
なんと美しい図なんでしょうか!?
Drawソフトで線を引くとき,Shiftキーを押したままポインタをドラッグしていくと,水平もしくは垂直の線が引けます.ソフトによっては45度をサポートしているものもあります.いずれにしても,Shiftキーを押してドラッグすることで,有意差の線などは引きやすくなります.
横軸の量がなってないし,無用な凡例が残っています.凡例は簡単に消せるので,そのくらいの手間は惜しまないでください.
また,横軸にきちんと量を入れるためには,その名前が入ったセルも含めてデータ範囲を選択するだけです.よくわからない場合にはグラフ作成ウィザードをしっかり活用してください.
上の図は有意差の表現の部分の縦棒を共用しているので,何がなんやらわからなくなっている例です.縦棒はそれぞれ対応する分をきちんと引いてください.
これは去年までもよく見られた間違いの一つですが,HSDを.01と.05で用意したときに,.01を満足する差が出たのなら,もう.05の方は不要なので,図は2つも要らないです.混在している時にもアスタリスクの数で区別できますので,いずれにしても図は1つにまとめてください.
より小さな危険率を満足するのなら,大きい方の危険率は不要です.
多重比較の表を作る場合には,平均値を小さい順に並べるという手順をWebテキストにも書いておきました.元々の並び順ではなく,小さい順に表を作ることで,一番右上のセルから見ていけば良いということになるので,作業が楽になります.そのための並べ替えです.
その他,多くの人の結論から抜けていたのが,危険率pの値です.分散分析表ができた段階で有意差があることはわかっていますが,多重比較は個々の平均値の間のどこに有意差があるかを見るために行うので,多重比較が終わった段階で改めて危険率も含めて説明してください.グラフにあるからと省いては困ります.
他には,「それぞれに有意差がある」というような表現を分散分析の段階でしている人がいました.分散分析では,平均値が有意に異なっていることまでしか言及できません.注意してください.
最後に,まだ, 3.52*10^-14 のような表現をレポートに書いている人がいました.Writerなどのワープロソフトには上付きや下付きの機能はもちろんついていますし,演算記号の × も日本語フォントではありますが用意されていますので,ちゃんと使いましょう.
最終的には以下のようになるはずです.
多重比較を行いました.分散分析と併用することで,どの平均値の間に有意な差があるかを見つけることができるものでした.データの解析の中で必要とする機会も多いので,きちんと理解しておきましょう.
資料を参考に予習してください.
2元配置の分散分析を行いますが,現時点でのCalcのバージョンでは「繰り返しのない場合」しか対応していないようです.そのため,統計ツールのANOVAでは大したことができません.
そこで,今回はPDF版の授業資料にそって分析を行います.
以下の手順に従って,まずはPDF版の授業資料の中の記号などに慣れていきましょう.なお,今回は簡単のために,全ての群でデータの個数が同じ場合を扱います.より一般的な,繰り返しの数が異なる場合についても当然できるのですが,この授業ではとりあえず繰り返しの回数が同じものだけに限定して実習します.
リンク先の資料を用いて練習を行います.まずは,準備してください.下図のようなデータがあらかじめ入っています.
2元配置分散分析では,たくさんの残差平方和を算出しなければなりません.求めるのは,SA, SB, SAB, SAxB, SE, ST です.
誤差の残差SEに対して,要因Aに関する残差SAや要因Bに関する残差SBが有意に大きいのか,また,要因AとBが同時に関係するSAxBが大きいのかを見ていきます.
一番簡単なのはST です.データの領域全体の devsq() を求めるだけです.((2)式は使わなくて大丈夫です.)これ以降,SA, SB, SAB, SAxBを求めるためには式(1)の全データの和を知る必要があります.これはD15のセルになります.全部でデータは3×2×4で24個ですので,Nは24です.E17に値が入れてあります.
Ti..とT.j.は,それぞれAについての和とBについての和なので,A1について全部足せばT1..,A2について全部足せばT2..のようになり,それらを足しあわせてデータ個数に対応するqrで割ったものから全体の和の2乗をNで割ったものを引く,ということをします.T.j.も同じです.今回はSA = 17.583, SB = 16.667 となります.
SABはそれぞれのブロックの和の2乗を使います.B3からB6,B7からB10のように各ブロックの和を2乗して足し合わせます.SABが求まれば,式(6)と式(7)からSAxBとSEが決まります.今回は,SAxB = 18.083, SE = 19.500 となります.
自由度は式(8)から(13)で求められます.
残差の平方和を自由度で割ったものが不偏分散です.ここでは V の記号とします.求めるのはVA, VB, VAxB そして VE です.それぞれ,8.7917, 16.667, 9.0417, 1.0833 となります.
VA, VB, VAxB を VE で割った普遍分散比が F です. FEA, FEB, FEAxB を求めます.それぞれ, 8.1154. 15.3846, 8.3462になるはずです.
最後に危険率を求めます.F分布なので f.dist() という関数なのですが,分散分析では分散比Fが大きいかどうかだけを判断しますので,片側検定(上側検定)になります.その際の関数は右 (right) がついて, f.dist.rt() になります.最初が値,次に分子の自由度,分母の自由度という引数仕様です.ここまでの結果を全部まとめると,以下の表のようになるはずです.
今回の二元配置分散分析の結論は以下のようにまとめられます.
リンク先の資料の表1のデータについて,二元配置分散分析により平均値について議論してください.
同じく資料の表2のデータについて,同様に議論してください.
次回は χ 2 検定について学習します.予習用の資料を参考に予習してください.
また,最後の授業なので,確認テストを実施します.準備の方もよろしくお願いします.
いつものレポート提出システムを利用して行います.
宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは授業前日火曜日の13:00までです.よろしくお願いします.
分散分析の結果は各平均値の間に有意な差があることを示す.
F1745 = 17.726, p = 3.524×10-14
グラフは図1に示す.
図1 多重比較の結果
結論
35度については,55度以外の全ての平均値との間で,55度についても35度を除く
全ての平均値との間で有意な差が認められた.(p < .01)
Back