TEDから学ぶ統計学
みなさん、TEDについてご存じでしょうか?
映画に出でくる下品なクマのことではなく、
アメリカで活動が行われている様々な分野の人物がプレゼンテーションを行われていることです。TEDを見るには、NHKの番組「スーパープレゼンテーション」で見ることもできますし、Browse Talks | TED.comのサイトで公開している動画を無料で見ることができます。今ではスマートフォンのアプリでも見ることが可能なので気軽に見ることができますね。
数あるTEDのプレゼンの中で、ここでは統計をとても面白くプレゼンする人物を紹介しようと思います。
ハンス・ロスリング(Hans Rosling, 1948年 - )は、スウェーデン・ウプサラ市出身の医師、公衆衛生学者。カロリンス研究所の国際保健学の教授および、スウエーデン・ストックホルムに拠点を置くギャップマインダー財団のディレクターを務める。
今回紹介する動画は、
ハンス・ロスリングのTEDデビュー作である『最高の統計を披露』です。
あなたの中にある「先入観」を変えてくれるでしょう。
いかがだったでしょうか?
この動画を見て統計の見方、考え方が変わったんじゃないでしょうか。
現在までTEDのステージに10回も上がっているというハンスロスリング。
こんなに出演している要因としては、やはり 「統計」という一般的に難しいものを面白可笑しく聴衆に見せつける技術がとても上手であると考えられます。
統計勉強会・3「時系列データを理解しよう!」
今回の内容は時系列データについて学んでいきます。
時系列データの特徴に関する記述のうち、最も適切なものを選びなさい。
- ある集団をある方法で分類したとき、それぞれの分類に含まれる人の割合を表しているデータである。
- ある学校の生徒に対して、身長や体重などの測定値を調べたデータである。
- ある集団の人々に対して、家族の数のように人数や個数を調べたデータである。
- 時間の経過とともに、連続的に観測されたデータのことである。
新聞やテレビ、インターネットのニュースでは、さまざまなデータが使われているが、最も使われているデータとしては時系列データであります。
たとえば、
日経平均株価【998407】:国内指数 - Yahoo!ファイナンス
ここには、日本の株式市場の代表的な株価の指標となっている
このように、時間の経過ともに連続的に測定・観測されたデータのことを
時系列データと言われます。
さて、今回の問題を見たとき時系列データとして正しいものは
時間の経過とともに、連続的に観測されたデータこそ時系列データなので
答えは4となります。
1は質的データのことを言っている
また、2は人数や個数を調べたデータのことであり、
3は量的データのことである。
統計検定のすすめ
この2日間続けてお伝えしてきた統計検定の想定問題ですが、「統計検定」についての詳しい説明を省いていましたので、ここでは統計検定とは何かお伝えしたいと思います。
統計検定とは、統計に関する基礎知識やデータ分析の活用を評価する全国的に行われている試験です。級には、簡単な4級から専門的知識が試される1級まであります。この試験は日本統計学会が2011年から実施しており、英検やTOEICなどに比べると歴史は浅く認知は低いです。しかし、ビックデータの活用を取り組む企業が増えているため、今後需要は増えると予想されます。
以下が統計検定学会の定める試験になっています。
級 | 試験レベル | 受験料 |
1級 | 大学専門課程(3・4年次)で学ぶ内容 | 10,000円 |
準1級 | 大学基礎課程を引き続いて学ぶ統計学の諸手法の内容 | 8,000円 |
2級 | 大学基礎課程(1・2年次)で学ぶ内容 | 5,000円 |
3級 | 高校卒業段階までに求められる統計を活用する内容 | 4,000円 |
4級 | 中学校卒業段階までに求められる統計を活用する内容 | 3,000円 |
情報化が進みビックデータ時代と言われる現在、世の中には様々な情報が溢れています。その情報を本質的理解し、活用するためには統計学的知識やデータ分析能力が必要不可欠になっていくと考えています。
この記事を読み、「統計検定を受けてみたい!」「興味を持った!」という人は以下のサイトをおすすめします!
統計検定:Japan Statistical Society Certificate
統計検定は統計の知識の力試しですので、
統計を学んでいる方はぜひ受験してみて下さい!!
統計勉強会・2「確率と場合分け問題」
今回は、じゃんけんを用いた確率についての問題を解いてみましょう。
Q.AチームとBチームの野球の試合において、じゃんけんで勝った方を先攻とし、あいこの場合はAチームを先攻を決めた。このとき、5回の試合の先攻を決める場合にあいこが1度も起こらず、Bチームが少なくとも一度は先攻になる確率はどうなるでしょう?
解説
まず1回のじゃんけんで「Aが勝つ」「あいこ」「Bが勝つ」の3つの事象がそれぞれ1/3で起こることがわかります。それぞれのじゃんけんは独立である(1回目の結果にかかわらず、2回目の確率は変わらないことを独立といいます)と仮定し、確率の計算を行います。あいこがなくて、Bが先攻となるのは次のような場合分けが出来ます。
Bが1回勝ち、Aが4回勝つ場合は5通り
Bが2回勝ち、Aが3回勝つ場合は10通り
Bが3回勝ち、Aが2回勝つ場合は10通り
Bが4回勝ち、Aが1回勝つ場合は5通り
Bが5回勝つ場合は1通り
それぞれは、(1/3)^3の確率で起こるので、
(5+10+10+5+1)×(1/3)^3
つまり答えは31×(1/3)^3となります。
統計勉強会・1「2種類の変数を覚えよう」
この勉強会では統計検定を想定した問題を解いて、丁寧に解説していきます。
「統計検定って何」と思う方もいると思うので先に簡単に説明すると、英語などでTOEICや英検があるように統計学にも統計検定というのが存在します。
つまり、統計学をどれだけ学んでいるか力試しできるところになっています。
※統計検定の詳しい説明については後日お伝えします。
では、さっそく問題を解いてみましょう。
Qこの3つのうち量的変数はいくつあるでしょうか?
a.今日の気温 b.体重 c.星座
解説
まずは、「質的変数」と「量的変数」とは何か見ていきましょう。
質的変数・・・変数の値が数値ではなく、種類や分類で表されているものや数値が割り当てられていてもその数値の和や平均をすることに意味がないもの。
量的変数・・・変数の値が数値であるもの。和や平均をすることができるもの。
今回はこの3つを見たとき、気温と体重は24度や150cmなど数値で表されています。
一方、星座はさそり座やふたご座など数値以外の種類で表されています。
つまり答えはaとbの2個となります。
統計学とは何か
まず「統計」とは何なのか。また、統計を扱う「統計学」というのは、いったいどんな学問なのだろうか。私たちの周りには、たくさんのデータが存在します。データとは「数値や事象の集合体」でありますが、それらの集合体を漠然と見たところで何も得ることはできません。しかし、データの数の平均を出したり、傾向を見たり、分類をするなど何らかの手を加えることによって、初めてデータの性質や意味を知ることができ、活用することができるのです。
ある程度の数のデータには、必ずバラツキが伴います。もしも、とある学校のテストの点数が全員同じであったら、平均点や順位、偏差値を出すことに意味はありません。一年中天気や気温が一定であったとしたら、天気予報は要らないし、気温をグラフに描く必要もありません。しかし実際には、学年やクラスによって点数は異なるし、地域や日時によって天気も気温もばらつきます。だから、クラス別の平均点や気温のグラフなどを描いて、クラスの特性を把握したり、明日の気温の予測を行います。
統計学とは、ある程度以上の数のバラツキのあるデータの性質を調べたり、大きなデータから一部を抜き取って、その抜き取ったデータの性質を調べることで、元の大きなデータの性質を推測したりするための方法論を体系化したものであります。
引用文献