2021/07/31

割合③ 現実社会で起こっている信頼できない統計データ【後】

前回はデータを見て判断してもらいました。今回は元データを提示し、問題点を考えていきます。

A県K市B小学校の5年生を対象に、2学期のあいだ毎週月曜日の朝に1週間の読書調査を行いました。下の表がその統計データです。A~Eの5クラスを15週に渡り調査を行い、調査結果は百分率で表しました。また、どのクラスも児童数は20人で、検査日の遅刻・欠席はありませんでした。調査対象の一週間というのは、先週の月曜日から前日の日曜日までです。


前回と同じものです。データは百分率表記

123456789101112131415
A504555455055655555605070606560
B30403525405065756560609010095100
C25302020152540100909590100859095
D1015102530253055506060100100100100
E505100100100100100100100100100100100100


データは実人数表記です。
123456789101112131415
A1091191011131111121014121312
B6875810131513121218201920
C56443582018191820171819
D23256561110121210101010
E101202020202020202020202020


前回触れなかったことをいいます。それはデータをどのように取ったかです。

Aクラスは、物語や小説および学術書に類するもので、受験参考書は含めていません。この条件で本を読んだ人に手を挙げてもらいました。

Bクラスは、6週目まではAクラスと同じでしたが、7週目からはHow-to本(手引書:参考書やパソコンの使い方など)も調査対象に含め、12週目からはゲームのHow-to本(手引書)も調査対象に含めました。

Cクラスは、8週目から本なら何でも調査対象に含めました。鬼滅の刃や名探偵コナンなどのコミックスもゲーム雑誌もナンクロも何もかもです。

Dクラスは、4週目からはHow-to本(手引書:参考書やパソコンの使い方など)も調査対象に含め、8週目からは本なら何でも調査対象にし、12週目からは本を読んでいるであろう成績上位者10名だけを調査対象にしました。

Eクラスは、4週目からは活字を読んだら本を読んだということにし調査対象に含めました。テレビの字幕でも、パソコンのコメント欄でも、ツイッターでも、ラインでも何でもです。


「ふざけるなっ!」と思ったなら、ふつうの反応だと思います。でも現実社会ではこのようなデータの取り方をしていますね。
データとして価値があるのは、Aクラスだけです。他のクラスは一切価値がありません。統計を取っているときに、統計の取り方を変えるのは言語道断です。変えた時点で、それまでのデータを比べることに意味がなくなります。上のB~Eはそれを解りやすくしたものです。現実社会で起こっていることを理解してくれたでしょうか。

さらに、Dクラスのように調査対象者を意図的に変えるのも言語道断です。でもこのようなデータ操作を頻繁に行われていますが、実数値でなく割合で表現されたらそれを見抜くことはできません。前回、最初に割合のデータを提示したのは目を眩ませるのが目的でした。そのようなことが行われているか否かは、元データが出てから判ります。

現実社会では統計学など学ぶ以前の問題が起こっているのです。この意味で、統計は数学の威を借る狐です。▢


前回も紹介しましたが、
谷岡一郎 著『「社会調査」のウソ リサーチ・リテラシーのすすめ』文春新書

は統計を学ぶ前に読む本だと思います。数学科で学ぶ数理統計は、「データに問題ない」が前提なので、データの取り方に問題があったら何の役にも立ちません。データに問題があるのに、数理統計を用いて分析したら人を欺くことに使われてしまいます。社会の動きに興味関心がなければ、数学はただの奴隷です。

0 件のコメント:

コメントを投稿

ちょっと・・・それは・・・ ~ 定義とその周辺の話 ~

内容的には高校数学なのですが高校生には難しいと思います。ただ高校生であっても定義・定理(命題)・公理の区別が出来ているのであればおもしろいと思うし、数学教師志望の教育学部や数学科の学生には興味深い話だと思います。 現在、 『数学事始め』 では指数関数・対数関数の話をしています...