計測工学基礎
2019.06.19
授業の後半で,確認テストを実施します.案内に注意していてください.
基本的な作業はほとんどの人ができています.ただ,前にも書きましたが,そろそろグラフの詳細や完成度,有効数字などに気をつけて欲しいです.今回のグラフでも縦軸や横軸の量をきちんと説明していないものが多く見られました.4つのグラフを作る形式でも良いですし,一つにまとめるのでも良いのですが,きちんと軸の部分まで完成させてください.
ダブルY軸を使うと以下のようになります.
そして,相関係数ですが,ものとのデータが大体3桁くらいなので,その辺りの有効数字になります. correl() 関数を用いて計算するだけなので,注意するのは有効数字くらいですので,以後は気をつけてください.
相関係数について実習しました.あらかじめ用意されている関数 correl() を使用することで,相関係数を求めることができました.ところで相関係数の大きさで相関の強さを表現することが一般的に行われていますが,実際に有意かどうかは今回の検定の結果を見てみないとわかりません.
資料を参考に予習してください.
無相関検定を行います.一般的な表計算ソフトには無相関検定の関数は用意されていません.そこで,以下の流れにそって簡単な作業をいくつか行います.
前回相関係数について学習しました.相関係数 r の絶対値が1に近いほど強い相関があり,0に近い場合には相関が無いと一般には言います.しかし,相関が有意なものかは相関係数の大きさだけでは判断できない場合があります.データの組が少ない場合などです.そのときに,相関係数の大きさから t 分布における t 値に直したものを利用して検定を行うことを無相関検定と言います.次からの例題で試してみましょう.
次に示す2つのデータについて,資料の式(1)から t 0 の値を求めてみましょう.
得られた t 0 の値に対して, t.dist() 関数により p 値を求めて,検定を行ってください.
リンク先のデータは世界各国の合計特殊出生率と女性国会議員の比率の表です.女性の社会進出と少子化の関連などいろいろと議論されていますが,女性が社会進出をしている一つの目安は国会議員に占める女性議員の比率があります.有意な関係があるのか,実際のデータで確認してみましょう.
日本の学術研究の停滞が危惧されています.リンク先のデータは主要国の研究開発に関係するデータを集めたものです.論文数について,研究費や研究者の多寡が有意に影響しているのか,調べてみてください.
次回は分散分析について学習します.予習用の資料を参考に予習してください.
いつものレポート提出システムを利用して行います.
宿題の公開は原則として授業の後13:00からとなります.また,提出の締め切りは授業前日火曜日の13:00までです.よろしくお願いします.
がんの種類 相関係数
膀胱がん 0.704
肺がん 0.697
腎臓がん 0.487
白血病 -0.068
現在日本の医学会では基本的にはひらがな表記の「がん」を遺伝子の突然変異によって細胞が増殖する悪性腫瘍全般に対して使用しています.一方,漢字の「癌」は臓器の表面の上皮細胞から発生する悪性腫瘍に限定して使用します.
データ番号 x y 1 2 12 2 5 5 3 6 18 4 9 19 5 12 4 6 14 8 7 15 11 8 19 26 9 25 29 10 27 12 11 28 21 12 31 16 13 34 28 14 36 17
データ番号 x y 1 3 10 2 5 15 3 6 17 4 9 11 5 12 18 6 15 19 7 16 28 8 17 16 9 19 24 10 24 26 11 26 19 12 29 31 13 31 25 14 33 39 15 34 27 16 38 40 17 40 29 18 41 38 19 43 44 20 48 32 21 52 46
自由度は n - 2 なので,上の場合で12,下の表で19ですね.
なお,このデータは文部科学省が公開しているもので,現在の政権の失政を隠すために,研究費の内訳が付属していません.諸外国が国の費用を中心に算出されているのに対して,日本は企業の研究費が大半を占めているため,大学の研究業績評価に対して用いることは適切ではないという批判がすでになされています.
Back