計測工学基礎
2019.06.05

Back



  1. 本日の作業内容

  2. 前回の宿題について

    前回の宿題ですが,実験結果をまとめると以下のようになるはずです.

    ほぼ直線になっていますので,グラフ上で近似曲線を挿入しても数式が得られますし, linest() 関数や slope() 関数でも傾きが求められます.傾きは, -25539.16 になりますので,ボルツマン定数やネイピア数 e を入れて計算すると, 8.12059×10 -19 [J]となります.単位を eV に換算しなおせば, 5.069 [eV] ということになります.

    さて,みなさんの結果は基本的には良いものの, eV への換算がおかしかったり,有効数字が考慮されてなかったりということで減点されるものが多く見られました.また,上のグラフですが, Calc から Draw へペーストした段階で下の図のように横軸の桁数が切られてしまうので,そのまま意味のない横軸の数値になっているものが実に多く見られました.

    Office系のソフトはペーストした後も属性が引き継がれているので,グラフの横軸の数値の部分をダブルクリックすると詳細設定のダイアローグを呼び出すことができます.「数」タブの中の「小数点以下の桁数」で今回ならば5桁を指定しておくと,上の例のように数字はきちんと表示されます.

    中には下の図のように近似直線がフィットしていないようなものもありました.なんで?ですが,きちんと確認しましょう.

    そして,依然として最小二乗法の意味がわかっていないような下のような結果を出した人もいました.

  3. 前回の復習

    前回は最小二乗法でした.今後は学生実験のデータ整理などでも活用してください.グラフに数式で表現される関係が背後にあることがわかっている場合には,どんどん使ってみてください.手計算しなくても,コンピュータを使えば簡単にできることがわかったと思います.

    また,宿題で扱ったように,一見難しい関係式も変数変換により直線近似が可能になる場合がありますので,こちらも学生実験で出てきた時には活用してください.

  4. 自習資料

    資料を参考に予習してください.

  5. 演習

    今回はt検定について学習します.t検定とは2つの平均値の違いを統計的に調べるものです.例えば,ある大学のある学科の男子学生と女子学生のTOEICの平均値がそれぞれ400と420だったとします.このとき,女子学生の集団のほうがTOEICの点数が「高い」と言えるでしょうか?もちろん,平均値は女子学生の方が高かったことは確かです.しかし,その違いに「意味がある」のでしょうか.このような2つの平均値の差に意味があるのかどうかを「検定」するのがt検定です.

    1. t分布

      これまで統計的に考える際に標本値は正規分布に従ってばらつくということを説明していました.正規分布であるかどうかは大量の標本の値が知られていて母集団がすでにわかっていることを前提にしています.すなわち,母平均と母標準偏差がわかれば正規分布の形を決めることができます.

      しかし,資料の方にも書いたように,実際の製造現場ではなるべく少ないサンプルで品質のチェックをしたいのが本音です.そこで,標本が少ない数でも統計的に扱えるようにゴセットが考えたのがt分布です.何が違うのかというと,母平均がわかっておらず,母標準偏差も未知であるという前提で,標本平均と不偏分散の平方根である標準偏差をパラメータにして確率密度関数を作りなおしたものです.

      ということで,まずはt分布の形を確認してみましょう.使用する関数は t.dist() です.引数仕様は,値と「自由度」と「関数形式」です.正規分布の時には平均値と標準偏差が必要でしたが,今回はそれは未知なので使用しません.その代わりに自由度を使用します.自由度が1〜8までのt分布を標準正規分布と一緒にグラフ化したものを図1に示します.まずは,これを作成してみましょう.


      t分布の形

      正規分布に比べて中央付近が低く,周辺部の値が大きめになっています.なお,自由度を無限大にすると,正規分布と一致します.

    2. t検定の練習

      先ほどのTOEICの点数ですが,実は以下のような得点状況だとします.このとき,試しにt検定を行ってみます.

      data #score (Male)score (Female)
      1360430
      2380470
      3430380
      4420420
      5410400

      1. グラフの作成

        授業の最初の頃に行った棒グラフに誤差範囲を表示させる方法で,男女別得点のグラフを作成しましょう.

        データ系列を選択して「Y誤差範囲挿入」でしたね.
      2. t値の算出

        まずは手作業で求めてみましょう.資料の(4)式に従って t 0を求めます.残差の平方和 Sx Sy の求め方は以前にやりました.各データの自乗の和から各データの和の自乗/データ数を引く,でした.

      3. t分布表

        昨年まではt分布表を配布していましたが,今回は自分で作成できるので自分で作ってみましょう.自由度は(4)式にもあるように nx + ny -2なので8になります.自由度8の危険率の計算をします. tinv()関数を使用します.

        ところで,危険率とは資料に書いてあるように,求めた t 0 の値がt分布の両端のどの部分に入っているかを示すαという量で表されます.統計的には,求めた値が確率密度のグラフの端の方(確率的には5%未満のエリア)に入っている時,偶然生じたものではなくある意味を持っていると解釈します.このエリアの中でも更に端の方ほど偶然でない確率が高まります.そのため,だいたい10%と5%,そして1%などが基準になります.これは両側の確率なので,片側はそれぞれ半分ですから,5%という時には2.5%ずつ,ということになります.

        tinv() 関数にそれぞれのαと自由度8を入れると,以下の表のようになるはずです.

        α.10.05.01
        t1.85952.30603.3554

      4. 検定

        資料のp.2の下半分からp.3にかけての説明を参考に今回の例でt検定を行ってみましょう.

    3. t検定用の関数

      Calcにはt検定を行う関数 t.test() が用意されています.引数仕様がややこしいので,注意してください.

      t.test(データ1,データ2,モード,タイプ)

      各引数の意味は次のようになります.

      データ1データ2モードタイプ
      1つ目のデータ範囲2つ目のデータ範囲1:片側確率
      2:両側確率
      1:対応のあるデータ
      2:2つの母集団の分散が等しい場合
      3:2つの母集団の分散が等しくない場合
       (ウェルチの手法)

      まず,片側か両側かですが,あるデータの平均値が別のデータの平均値よりも大きいかだけ,もしくは,小さいかだけを検定する場合には片側検定となります.t分布の右端もしくは左端の5%部分に入っているかどうかを見ます.一方,両側検定の場合には大きいか小さいかに関係なく,異なっているかを考えます.ですので,t分布の両側2.5%ずつのエリアに入っているかどうかを見ます.

      次にタイプのところにある3つの分類ですが,1の対応のあるデータとは一人の人が2回試行してその間に違いがあるか,のような場合です.2つの群のデータを見る場合は通常は2の分散が等しい仮定で実施します.3は分散が異なることが予想される場合ですが,こちらは必要に応じて出てきたら説明します.

      t.test() の実行結果は一つの数値で返ってきます.その数値は危険率と呼ばれるものになっており,通常はアルファベットの p (小文字)で示されます.資料の方に簡単に説明がありますが,2つの平均値に差がないとする帰無仮説を否定するときに間違っている確率です.先程も書きましたが,通常は5%未満になると,帰無仮説を棄却しても良いということになり,2つの平均値の間には有意な差があるとしてもよいことになっています.

      TOEICのスコア 検定結果
      
      男子学生の平均点:400点
      女子学生の平均点:420点
      
      帰無仮説:両者の平均点には有意な差は無い
      対立仮説:両者の平均点には有意な差がある
      
      t検定の結果: 危険率 p = .3466 (Φ = 8)
      
      よって帰無仮説を棄却できない(対立仮説は棄却された)
      
      結論:両者の平均点には有意な差は無い
      
      

      もし,危険率が5%未満だった場合には,結論のところに例えば以下のように記述します.

      結論:両者の平均点には有意な差がある (p = .0**, Φ = **) [注: ** は適当な数値]
    4. 実際の検定

      リンク先のファイルを利用して,以下の項目に関してt検定を行ってみましょう.なお,それぞれ検定の結果を棒グラフでも表現してみてください.例えば,上で行ったTOEICの点数の場合ですと,有意差はありませんでした.その場合には棒グラフの上の方に有意差なしを表すn.s.というシンボルと線を表示します. n.s.とは not significant の略です. 0.1% 未満の危険率で有意差がある場合には *** とアスタリスク3個, 1% 未満だとアスタリスク2個で ** , 5% 未満で1個 * と記号をつけます.この有意差表現の挿入はCalcでは大変なので,グラフをコピーして図形描画のDrawに貼り付け,ドローソフトの機能を利用して行います.

      「ファイル」メニューから「新規作成」,そして「図形描画」で起動しますので,そちらで行ってください.鉛筆に曲線が表示されているボタンの小さい三角形の部分をクリックして折れ線のアイコンを選択することで,なべぶた型の線を引くことができます.クリックするたびに折れ曲がる点を指定しますが,最後ここで終わりというポイントまで来たらダブルクリックで終了です. Shift キーを押したまま線を引いていくと水平や垂直の線限定となるので引きやすくなります.線を引いたら中央付近に有意差の有無を意味するマークをテキスト入力で行ってください. T の表示のアイコンを選択することで文字入力になります.

      1. 計測工学基礎の平均点

        5月15日の宿題で使用した過去の計測工学基礎の成績の平均点について,2017年度以前と2018年度で平均点に差があるかどうかを見ましょう.2016年と2017年のデータは一緒にして考えます.

      2. 予習の効果

        2018年度の計測工学基礎の期末試験の時に毎週しっかり予習をしたか,あまりしなかったかというアンケートを取りました.その結果も添付の資料につけています.

        予習を十分に行ったというグループとほとんど予習しなかったというグループの平均点に有意な違いがあるかを検討しましょう.

      3. 教室内の席次の効果

        2017年度の計測工学基礎の期末試験の時には,授業はだいたい教室のどの辺りで受けていたかのアンケートを取りました.このデータも添付してあります.前の方で受けた学生のグループと後ろの方で受けた学生のグループの平均点に有意な差があるか検討しましょう.

  6. 次回の予習範囲

    次回は相関係数について学習します.予習用の資料を参考に予習してください.

  7. 宿題

    いつものレポート提出システムを利用して行います.

    宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは授業前日火曜日の13:00までです.よろしくお願いします.


Back