「生物統計学」:有用性と単位取得について
こんにちは!
今回は2年時に履修できる(2024年当時)「生物統計学」について解説していきます!
生命系の学科なのに統計学?って思うかもしれませんが、生命科学にとって統計学は必須になります!確かに内容は難しいんですが生物系の学科なのに統計学も学べるなんて得じゃないですか!?
しかも、この授業、「ただ難しいだけ」じゃなくて、めちゃくちゃ実践的な授業なんです。 今日は、私が2024年に受講した体験をもとに、この授業の「超実践的」な中身を紹介します!
1. 授業は出席点、最終レポートで評価!(最終レポートについては後述)
この授業、ただ先生の話を聞いて終わりではありません。 私が受けた2024年度のスタイルは、こんなルーティンでした。
- Step 1: その週のテーマ(新しい統計手法)を学ぶ
- Step 2: 「R言語」というプログラミングを使って、PCで実際に解析する
- Step 3: 出された課題(データ解析)を提出する ← これが出席代わり!
そう、「課題を出さないと出席にならない」というシステムなんです! 毎週、実際に配られたデータを解析して、「このデータから何が言えるか?」という問いに答え、それをmanabaに提出します。
「え、毎週課題!?」と思うかもしれませんが、逆に言えば「毎週必ずプログラミングに触れる」ということ。最初はキーボードを打つのも恐る恐るでしたが、継続は力なりです。
2. 扱うデータが「ガチ」すぎる!
課題で渡されるデータは、教科書的なサイコロの話…ではなく、本物の生物データです。
① 南極海のクジラを数えろ!
授業資料では、実際に南極海で行われた「クジラの目視調査」のデータが出てきます。 広い海にいるクジラを全部数えるのは不可能。そこで、発見した頭数や距離から、全体の数を「推定」します。 「フィールド調査×数学」という、冒険する生物学の側面が見られます。正直難しい。
② がん患者の「遺伝子」を探せ!
ある週の課題では、大腸がん患者さんの組織から取った「遺伝子発現データ」を解析しました。 何千個もある遺伝子データの中から、「正常な組織」と「がん組織」で動きが違う遺伝子を、PCを使って見つけ出す。これぞ生命科学!という感じです。
③ ラットの成長をグラフ化せよ!
30匹のラット(実験用ネズミ)の体重変化のデータを、「主成分分析」という手法で解析したりもします。 ごちゃごちゃしたデータを、「成長が早いグループ」や「小柄なグループ」に一瞬で分類してグラフにする。 AI開発などでも使われるデータサイエンスの技術を、ここで身につけます。
3. ラスボスは「自由テーマ」の最終レポート←これめっちゃ重要!筆者はそれまで毎週のレポート不正解ばっかだったけど、これを頑張って単位をとりました!
毎週の課題も大切ですが、成績を決める最大の山場…それが「最終レポート」です。 実はこの科目、最終レポートの点数の比重がかなり高いんです。タイトルにあるように、筆者はこれを頑張って単位をとりました。
その内容はズバリ、 「自分で好きなデータを集めて、好きな手法で解析して、結果を出せ!」
テーマは何でもありです。
- 自分の所属するサークルの記録データ
- 気象庁とかの公式のデータ
- もちろん、興味のある生物のデータ
「何でもいいよ」と言われるのが一番難しいですよね(笑)。 でも、自分で問いを立てて、データを集め、授業で習った「統計手法」を選んで解析する。このプロセスは、4年生からの卒業研究そのものです。
私は最終レポートでは私の好きなJ1のサッカーチームのスタッツについて主成分分析を行いました。

元となるデータ

主成分分析で得られた第1、第2主成分を軸として用い、チームごとに図としてプロットした図

クラスター分析も行いました!実際のレポートではこんな感じでただ図を乗せるのではなく、ソースコードや説明も添付しましたよ~
まとめ:統計学はやっといたほうが良いし、
正直に言うと、授業では「最尤法(さいゆうほう)」だの「一般化線形モデル」だの、呪文のような単語がたくさん出てきます。難易度は高いです。
でも、安心してください。 この授業の良いところは、「手計算させない」ところです。 複雑な計算は全部パソコン(R言語)がやってくれます。難しさは、統計手法の原理と、コーディングです。ここをしっかりできれば、力になるし単位もとれます。
もちろんAIにやってもらう、でもいいんですけどこれから絶対に使うことなので私はとりあえず解いてみることをお勧めします。
中央大学の生命科学科に来れば、生物の知識だけでなく、こうした「データを読み解く力(データサイエンス)」もしっかり身につきます。 「生物も好きだけど、PCや分析もカッコイイな」と思っている人には、間違いなく最高の授業ですよ!