集計表の基本的なチェック方法

集計表の基本的な見方について、アンケート調査に慣れていないとわかりにくい点があります。当社で集計代行を受託した場合にもお問合せをいただくことがありますので、ポイントをまとめておきたいと思います。

なお集計表は当社が使用している「エクセル太閤」の出力結果ですが、説明内容は集計表についての一般的な内容となっています。

単純集計をチェックするための5つのポイント

↑クリックすると拡大します

単純集計はアンケートの対象全体について集計したものになります。右のような形で選択肢毎に割合を示すようになっています。一般的には回答数(実数)と割合(%)の両方を示します。アンケートの分析は割合(%)が基本となるケースも多いのですが、実数も必要です。実数はnで示されることが多くなっています。

基本的なチェックポイントは次のとおりです。

【1.ワーディング】
集計表の言葉の表記が適切かを確認します。

データ入力上、選択肢は番号で入っていることが一般的です。今回の例で上から1番めの集計表で仮に選択肢番号1の設定が「女性」となっていると、本来は「男性」の結果ですので誤りとなってしまいます。

また理由を選ぶような場合には、選択肢が文章で長く集計表上は省略するケースがありますが、適切な省略がされているかを確認する必要があります。

【2.回答数】
アンケートの全体の回答数が合っているかどうかを確認します。今回の例の場合、基本になる回答者数は400人です。アンケートの設定が誤っている場合には、この数がずれてくる可能性があります。

またアンケートの対象者すべてが回答しない質問がある場合もあります。例えば、3番目の集計表は回答の「全体」が329人となっていますが、これは一つ前の質問の「セルフコーヒーチェーンを利用しますか?」で「利用しない」が71人いるためで回答者数全体としては正しいです。アンケートの分析が割合(%)中心であっても、集計表で実数が必要なのはこのような確認をするためです。

【3.選択肢毎の数】
単純集計の場合、選択肢毎の実数の合計(不明を含む)が全体の合計と一致しているかを確認します。複数回答の場合は100%を超えている必要があります。

【4.「その他」の確認】
「その他」の割合を確認します。「その他」の割合があまりに多い場合は望ましくありません。目安として5%程度までが一般的で10%を超えるとはほとんどありません。

「その他」については内容を具体的に書いてもらうのが一般的ですので、この自由回答を確認し、(1)既存の選択肢の内容に含まれるものがあれば反映します (2)いずれの選択肢にも含まれない場合で共通した項目があれば新しい選択肢を作ります。

例えば海外旅行の行き先を質問する場合、日本人にとってメジャーな国や地域をメインにして残りは「その他」にすることになります。この場合「その他」の自由回答に「ハワイ」が書かれていた場合、「アメリカ」に変更するというのが(1)です。これに対して「その他」で「バリ島」が多く、選択肢に「インドネシア」がない場合に「インドネシア」を新しく作るのが(2)です。

「その他」の割合が多いのは選択肢が不十分であり、回答しにくい調査票ということになります。上記の例のうち(1)について「ハワイ」は「アメリカ」の一部ですが、旅行のパンフレット等では「ハワイ」は「アメリカ」と別になっていることが多いので、誤って回答することはあり得ます。そのため、選択肢を表記する際「アメリカ(ハワイを含む)」としておけば防げます。(2)についても日本人の旅行先上位を調べておけば防げます。いずれも調査票作成上の問題ですが、事後の対応としては上記の2点が考えられます。

【5.無回答の数】
「不明(無回答)」についても、「その他」同様割合が多い場合は確認が必要です。よくあるのは【2.回答数】でも触れた対象者の絞り込みが必要な質問になる箇所で絞り込みがきちんとされていないケースです。今回の3番目の表の例で回答者数を329人ではなく400人で計算すると18%近くが「不明」となってしまい。絞り込みが誤っていることがわかります。

アンケート設計上、質問文に「〇○を選んだ方は○にお進みください」などの絞り込みが必要な個所は明確しておく必要がありますが、不明確な場合もあります。この場合は事後に合理的な範囲で絞り込みを行います。

また、調査設計に失敗すると、どうしても答えられない質問が出てきます。このような質問の取扱いをどうするか、分析から外すかどうかなどについて検討する必要があります。アンケート集計では「不明(無回答)」を外した集計をすることもありますが、一次集計の段階では調査票のチェックのためにも無回答(不明)を含む集計をすることをお勧めします。

その他
上記の点は選択肢形式の基本的なチェック方法となります。アンケートではその他にも数量を回答するものなどがあります。数量の場合には平均値と最小値、最大値を確認することである程度のチェックが可能です。よくあるのは回答で空欄のままではなく0を入れなくてはならない箇所に0が入っていないために平均がおかしくなることです。最小値が0となる可能性がある場合は0になっているかを確認します。また表形式で質問した場合、項目ごとの数値を足し上げたものが回答者が合計で記入したものと一致しないことも生じます。この場合には対象者に確認することが原則です。

クロス集計の見方とチェックポイント

↑クリックすると拡大します

クロス集計は右のような形式となります。表の左側の項目が分類となり、一般的に表側(ひょうそく)と呼びます。表の上側が集計対象となる項目で一般的に表頭(ひょうとう)と呼びます。

上の表はチェーン別に男女の比率をみたもので、スターバックスを最もよく利用する回答者の中では女性が多く、ドトールコーヒーを最もよく利用する回答者では男性が多くなっています。これに対して下の表は男女別でみたもので、男性・女性ともスターバックスが最も多くなっています。

ちなみに日本では表側が分類、表頭が集計対象であることが多いですが、欧米では逆のケースがの方が多くなっています。グラフについても、単一回答の場合日本では横帯で分類が右側に示されることが多く、欧米では縦帯で分類が下に示されることが多くなります。

単純集計でのチェックがしっかり行われていれば、クロス集計のチェックポイントは多くありません。基本的には次の2点です。

【1.表側(分類項目)が単一回答になっているか】
特殊なケースを除き、分類項目は単一回答であることが必要です。性別や年齢といった属性ではなく質問項目間でクロス集計をとる場合には複数回答になるケースも生じますが、複数回答の場合は分類があいまいになってしまいます。

例えば事例のようなコーヒーチェーンの場合、よく利用するチェーンを複数で、そのチェーンを利用する理由を質問したとします。スターバックスとドトールを回答した回答者が、理由の回答で「たばこが吸えるから」を選ぶと、スターバックスでも、ドトールでも「たばこが吸えるから」という回答が生じます。スターバックスは原則禁煙ですので、回答として不自然に感じられます。この回答者に最も使うチェーンを1つだけ選んでもらい、それがドトールであれば「たばこが吸えるから」は不自然な回答ではありません。

【2.単純集計と矛盾がないか】
単純集計のチェックが済んでいれば、その結果とクロス集計の表頭・表側の数が一致していれば問題ありません。例示の上側のクロス集計表であれば表頭の男性・女性がそれぞれ200人で、計400人で一致しています。表側のチェーンの数もそれぞれ一致しています。チェーン数を合計しても400人にはなりませんが、これは「セルフコーヒーチェーンを利用しない」と回答した回答者が71人いるためで、集計結果としては合っています。ちなみに下側のクロス集計表はコーヒーチェーンが集計対象ですので、表頭の合計が329人でこちらも問題ありません。性別の無回答がいないため男女の合計も329人で質問自体の絞り込みと一致しています。

まとめ

基本的な集計表の見方、チェック方法は上記のとおりです。アンケート調査会社が集計をする際には、上記のようなチェックをした上で集計結果を提出しています。指摘されれば当たり前のことも多いのですが細かい内容も多く、経験のいる作業です。

上記のポイントをおさえれば、経験のない方でも集計のチェックは可能ですし、調査結果をある程度適正化することも可能です。ただし、あくまでも事後のチェック方法や対処では限界があります。本来は調査設計(調査票の作成時)に回答しやすいものを作ることが必要です。また上記でもわかるようにクロス集計の分類は単一回答であることが望ましいので、クロス集計分析で使いたい項目については最初から単一回答化するなども工夫も必要です。