instrumentaion 2019-06-26

計測工学基礎
2019.06.26

Back



  1. 本日の作業内容

  2. 確認テストの結果について

    全体的には,最後まで解答できていない人が多く見られました.私の想定ほど作業の自動化ができるレベルになっていなかったようです.まだ慣れていない状態の人が多かったということでしょうか.学生実験のレポート作成でも積極的に使用して作業に慣れてください.

    他には,単純なところから行くと,英語の significant を和訳した「有意な」という表現がかな漢字変換の最初には出てこないので,「優位」になっている人がいました.気をつけましょう.また,「有意はない」や「有意がある」というような謎の表現も出ていたりしたので注意してください.

    有効数字についてもまだまだな人が多くいました.表の中でも有効数字を意識してください.特に,解答につける場合には有効数字の範囲で丸める操作が必須です.

    セルを右クリックして出てくる「セルの書式設定」で一番左の「数値」タブを選択し,「カテゴリー」の中の「数」を選び,「オプション」の「小数点以下の桁数」を選択することで小数部分の桁数指定ができます.
    内容に関してですが,まず検定を学習した直後にありがちなこととして,データの値の表から直接検定を行って有意差の議論をしている人が結構いました.t検定は何を検定しているのか,というと平均値に有意な違いがあるかどうかを見ているので,まずは平均値を求め,その値を元に議論するので,平均値はしっかり求めて記録しておいてください.

    また検定の表現では,何度か説明していますが,「なになにをしなければならない」ということはありません.帰無仮説を棄却できるかどうかです.また,その意味がわかっていないために危険率を正しく求めているのに結論が逆になっている人がいました.危険率 p は次のように理解してください.

    帰無仮説を棄却するときそれが間違っている確率(間違える危険性の確率)

    ですので,間違うかもしれない確率が5%未満であれば,統計的にあまり起こらないこととしても構わないと判断するということです.ですので,危険率が小さいほど確からしくなります.また, p は0と1の間の数ですので,小数のままで議論してください.今回のように, p = .3045 とかになったとき,別に30%とかの表現に変えないで,そのまま小数で説明してください.

    最後に無相関検定ですが,意味がわかっていない人がこれまた多く見られました.平均値の差を議論するのはt検定であって,無相関検定は相関の有無を検定しているので違うものです. p < .05 であれば,2つの変量の間の相関が有意ということですので,間違えないでください.

  3. 前回の宿題について

    答案に名前がなかった人がいます.注意しましょう.

    番号と名前無し: b1603

    さて,今回大変驚いたのは横軸に年収を当てている人が大半だったことです.通常グラフを作成する場合,横軸が独立変数,縦軸が従属変数とします.関係性がわかりにくい場合でも,原因となるものが横軸で,その結果が縦軸とすべきです.つまり,今回の例では年収は縦軸の方に取るべきです.そういうことにも気をつけてください.

    さて,結果ですが,簡単に言うと「営業利益率」を出して,それと給与との相関を見るだけです.純利益➗売上高ですね.グラフは以下のようになります.

    この時の相関係数とそれから求められる無相関検定の危険率は以下の表のようになります.

    S18の学生さんは,昨年6月に出雲村田製作所であの会社の売りが営業利益率が10%を越していること,と,説明を受けたのを忘れてしまいましたかね?

  4. 前回の復習

    前回は無相関検定でした.有意な相関かどうかを見るものでしたが,検定の場合はまとめの表現が難しいので,早いところで慣れておくようにしましょう.

  5. 自習資料

    資料を参考に予習してください.

  6. 演習

    2つの平均値の間に有意な差があるかどうかはt検定により確認できましたが,平均値の個数が3つ以上になると,t検定では確認できません.そこで分散分析を行うことになります.今回は分散分析について実習します.

    1. 1元配置分散分析

      t検定で実施した平均値の検定ですが,平均値の個数が3個以上になると分散分析で有意差について検討します.その際に,単純に平均値の個数が増えただけの状態が1元配置となります.学校のクラスの平均点などでは1組〜5組までを考える,というような場合がそれに相当します.このようなクラスの違いを「要因」と言い,5組まであるのなら「水準」が5というように言われます.一方,1年生から3年生までのそれぞれ各クラスというようになると,要因が学年とクラスの2つになりますので,そのような場合は2元配置と呼びます.2元配置は後ほど行うことにして,今回は1元配置の分散分析について考えます.

    2. 実際の検定作業

      最近の表計算ソフトでは分散分析はあらかじめ用意されていますが,単純に関数一つでできるようなものでも無いので,メニューから呼び出して使用する形式になっています.以下の例で試してみましょう.

      1. データ

        使用するデータはリンク先のものとします.このデータには水準がA〜Dの4つあります.以下の手順で分析してみましょう.

      2. 分散分析

        「データ」メニューの一番下にある「統計」を選択し,その中の「分散分析(ANOVA)」を選びます.そうするとウィザードが表示されるので,それに従って作業していきます.

        データ項目の入力範囲はデータの範囲を指定します.今回のデータでは左端の番号は不要です.項目名のA〜Dの行は入っていてもいなくても構いません.

        結果貼り付け先は,自分で結果をペーストするセルを選択してください.ただし,結果は表(分散分析表)になって出てきますので,注意してください.この場合では13行×7列で出てくるはずです.

        種類は一元配置,グループ化は列データを使用していますので,そのまま列を選択します.パラメータのαは0.05のままで別に構いません.

        全て終わったらOKをクリックして結果を見ます.

      3. 検定結果

        検定結果は以下のようになり,なんとエラーが表示されます!

        これは残念ながら Calc のバグです.残差平方和の総合計の部分なのであまり影響しないといえばしないのですが,それでも気持ちが悪いので直しましょう.そのセルを選択して,上の数式表示欄の全てを選択し,自分自身のセルに貼り付けるとなんと不思議なことに値が表示されます.式自体は間違っていないのでした.508のエラーコードは数式のカッコについて開きと閉じの数が合わないというエラーなのですが,数式には間違いはありません.

        ちなみに,数式の devsq() という関数ですが,残差の平方和を計算してくれる関数です.実はこれを使うと残差は簡単に求めることができていたのですね.
      4. 分析

        分散分析表には簡単な説明もついていますし,資料の方にも載せているのでそれを参考に見ていきましょう.まずは,各グループの平均と分散が計算されています.続いて下に分散分析表が来ます.

        群間の変動と群内の変動,自由度,残差の平方和( SB SW ),それらの比( F 値),そしてその F に対応する危険率 p ,最後が p =.05になる F の値という順番です.

      5. 検定結果

        この例題の検定結果は以下のように記述します.

        群A〜Dに関して以下の平均値が得られた.
        m A = 4.6, m B = 5.5, m C = 6.4, m D = 7.0
        
        帰無仮説: これらの平均値の間には有意な差はない
        検定結果: F (3,33) = 5.19, p  = .0048
             よって,帰無仮説は棄却可能
             
        これらの平均値の間には有意な差がある
        

        ただし,分散分析単体ではどの平均値の間に有意な差があるかはわかりません.それについては次週の多重比較で扱います.

    3. 計測の成績に関するデータの分析

      これまで見てきた過去のこの授業の成績ですが,今回は分散分析で実施してみましょう.

      このデータを使用してください.

      1. 年度別成績

        2016年度から昨年度までの平均点には有意な差があるのか,検討してください.

      2. 予習の効果

        昨年度行った予習に関する調査で,しっかり予習した人,そこそこ予習した人,そして,ほとんど予習しなかった人の成績には差があるのか,見てみましょう.

      3. 座席の影響

        前方に座って授業を受けた人,真ん中辺りの人,後方の人の成績の間に有意な差があるのか,見てみましょう.

  7. 次回の予習範囲

    次回は多重比較について学習します.予習用の資料を参考に予習してください.

    また,次回は後半で確認テストを実施します.範囲は1元配置分散分析と多重比較ですので,しっかり予習をしておいてください.

  8. 宿題

    いつものレポート提出システムを利用して行います.

    宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは授業前日火曜日の13:00までです.よろしくお願いします.


Back