大学講義アーカイブ

【大学講義アーカイブ】データ分析Ⅰ~ヒストグラム~

大学講義アーカイブ

量的変数と質的変数

データ分析を行う上で、そのデータが「量的変数」か「質的変数」かどうか非常に大事です。

量的変数

量的変数は、字のごとく「量(数値)」によって表せられるデータを指します。

身長や体重がいい例で、すべて数値で表すことができます。

質的変数

質的変数は、量的変数とは対極的な関係にあり、「量(数値)」によって表すことができません

性別や職業など、ある一定のカテゴリーに対するデータであることから、カテゴリー変数とも呼称されます。

ヒストグラム

データの出現頻度を把握する際には、測定値をグループに分けて、そこに属するデータを数えれば良いです。これに適したグラフをヒストグラムと言います。

この時、グループ分けした区間を階級と言います。分析したい値の最低値と最高値から、階級を設定するのがいいとされています。

次に、階級に含まれる測定値の個数をその階級の度数(頻度)と言います。

度数を階級ごとに整理した表を度数分布表と言います。これを元にヒストグラムを作っていきます。

Excelにおける作成法

★使用データ(Excel):ダウンロード
★問題データ(PDF):ダウンロード


Excelは、ワンタッチでヒストグラムを作る機能があります。しかし、それを利用するには初めに階級を設定する必要があります。

今回問題文によれば、階級値は「10点以下→10点を超え、20以下→20点を超え、…」と書いてあるので、次のように設定します。

後は、ワンタッチで作ることが出来ます。

データ分析の有効化

ヒストグラムを作成する前に、データ分析機能が利用できない場合は、有効化する必要があります。

①ファイル→オプションより、下記のウィンドウを開く。

②アドインを選択する。③管理より設定を開く。

④データ分析にチェックを入れる。

ヒストグラムの作成

①データタブを開き、②データ分析をクリックする。

③入力範囲を選択します。実際のデータが存在する場所です。今回であれば、学生の点数がこれにあたります。

④データ区間を選択します。⑤では、グラフ作成にチェックを入れてください。

OKを押すと、度数分布表と共にヒストグラムが完成しています。

コメント

タイトルとURLをコピーしました