連載 Tourism Informatics (TI) の試み(16)
おきなわ観光情報学研究会


データの尺度に4分類

岡崎威生(琉球大学工学部講師)

 意識調査は、観光客や観光事業者に対してあるいはその関連集団などに対してもおこなわれることが多いが、様々なタイプの質問項目が設けられる。性別や年齢、予算や満足度などの質問項目は、調査実施者が調査目的に照らして決定される。この質問項目は、性別など解釈の余地が無く明快なものは別として、満足度など抽象的・主観的なものは、質問者と被験者とで設問に対する解釈に違いが生じやすい。勿論この違いが小さくなるように設問の表現を工夫すればいいのであるが、主観的な域を抜けえない。今回は、収集したデータを集計・解析する立場からデータの性格による分類について述べたい。データの性質が明らかになれば、それに適した質問表現をすればよいという論理である。

 データの尺度を基準とすると次の4種類に分類できる(数理工学社「工学のためのデータサイエンス入門」参照)。

【類別尺度データ】は、定性的なデータをいくつかのカテゴリに分類するものである。性別や職業などが該当する。各カテゴリを「1、2、3、…」のように記号化しても、その大きさ順序に意味はない。

【順序尺度データ】は、定性的なデータでカテゴリ間に大小、強弱関係が存在するものである。主観的評価の「満足、どちらでもない、不満」や洋服のサイズ「S、M、L、LL」などが該当し、記号化にあたっては順序関係を明示するものが望ましい。

【間隔尺度データ】は、定量的データで、値の差に意味はあるが比には意味がないものである。摂氏温度や経度などが該当する。

【比率尺度データ】は、定量的データで差だけでなく比にも意味があるものであり、絶対的な「0」をもつ単位で計られたものである。長さや重さ、絶対温度などが該当する。

 これら尺度の違いにより適用されるべき解析手法が異なってくる。また、高水準のデータは低水準のデータに変換することが可能な場合が多い。例えば、比率尺度の身長を「低、中、高」と分類しなおせば順序尺度データとなる。関心の対象が同じものでも、目的と測定法によって尺度を選択する必要があるということである。

 調査はデータ収集がゴールでなく、そこから何を結論づけるかが重要である。結論づけに利用できるデータを集めることを念頭にすれば、質問の形式・表現はおのずと定まってくると言える。(okazaki@ie.u-ryukyu.ac.jp)(「観光とけいざい」第664号04年9月15日)


 |  連載17 |  HOME |
本ホームページに掲載の記事・写真の無断転載を禁じます。すべての著作権は沖縄観光速報社に帰属します。
Copyright (c) 1996 Okinawa Kankou Sokuhousya. No reproduction or republication without permission.