2021/07/24

割合② 現実社会で起こっている信頼できない統計データ【前】

 A県K市B小学校の5年生を対象に、2学期のあいだ毎週月曜日の朝に1週間の読書調査を行いました。下の表がその統計データです。A~Eの5クラスを15週に渡り調査を行い、調査結果は百分率で表しました。また、どのクラスも児童数は20人で、検査日の遅刻・欠席はありませんでした。調査対象の一週間というのは、先週の月曜日から前日の日曜日までです。

このデータをみて、本離れが続いているという噂は本当なのでしょうか。

123456789101112131415
A504555455055655555605070606560
B30403525405065756560609010095100
C25302020152540100909590100859095
D1015102530253055506060100100100100
E505100100100100100100100100100100100100

※ 左の縦1列目はクラス名を表し、横1行目は何週目かを表しています。
※ 百分率はパーセント(%)のことです。
(このパーセントというのは、100点のテストで何点取ったかを表しています)

例えば、上から4行目、左から6列目に「15」という数値がありますが、これはCクラスの5週目の割合を表しています。つまり、5週目はCクラスの対象者の15%がこの1週間に読書をしたということです。


さて問題です。あなたならどのような分析をしますか。例えば、
①どのクラスが、読書習慣があると思いますか。
②Eクラスは4週目から読書率100%になりましたが、何があったと思いますか。
③このデータで気になることがあれば、それらをすべて挙げてください。
※正解を求めているのではありません。


自分なりの判断ができましたか。
では次に、上の元データを提示します。

123456789101112131415
A1091191011131111121014121312
B6875810131513121218201920
C56443582018191820171819
D23256561110121210101010
E101202020202020202020202020


これらの数値は1週間内に本を読んだ児童数を表しています。例えば、上から4行目、左から6列目に「3」という数値がありますが、これは5週目にはCクラスの3人がこの1週間に読書をしたことを表しています。


またまた問題です。この元データを見て、先ほどの分析を変えますか。また、気付いたことはありますか。ところで、このデータから本離れが起こっていると思いますか。


私の作ったデータですが、参考にしているのは現実社会で表に出ている統計です。
自問自答になりますが、こういうデータで気になることを書きます。
①本離れの真偽を調べるための調査であれば、比較できるデータが必要ですが何の提示もないところが気になります。
②読書とは何か、対象図書は何かについて言及がないのが気になります。
③データの計算式の提示がありません。
④この場合は、どのクラスも20人であるし値が小さいので実人数でいいように思う。割合を使う意味はあるのか。
⑤BCDEとも割合が高くなっているが、何が起こったのか寸評がない。
⑥Dクラスは12週目から実人数が10人なのにデータでは100%になっているのは何故か。
⑦Eクラスが100%になったのは、強制的に読書をさせたと考えられます。

したがって、読書離れについての判断は不可能です。また、どのクラスが読書習慣が身についているかは判断しかねます。読書習慣をクラス毎に分析する意味が理解できません。ちなみに、データを読んだ本の冊数にしても同じようなことが言えます。読んだ冊数に意味があるか否かが問題になります。

次回は、このような統計データの問題を明らかにします。▢


以前読んでおもしろかった本を紹介します。
谷岡一郎 著『「社会調査」のウソ リサーチ・リテラシーのすすめ』文春新書

読書記録をみると、読んだのは5年前です。この頃は「欺き」に興味関心があり、オカルトによる欺きも調べていました。なぜ興味をもったのかは忘れてしまいましたが、記憶の嘘についての本も読んでいました。

0 件のコメント:

コメントを投稿

ちょっと・・・それは・・・ ~ 定義とその周辺の話 ~

内容的には高校数学なのですが高校生には難しいと思います。ただ高校生であっても定義・定理(命題)・公理の区別が出来ているのであればおもしろいと思うし、数学教師志望の教育学部や数学科の学生には興味深い話だと思います。 現在、 『数学事始め』 では指数関数・対数関数の話をしています...