連載 Tourism Informatics (TI) の試み(26)
おきなわ観光情報学研究会


データマイニング方法論

岡崎威生(琉球大学工学部情報工学科・講師)

 先日、ある観光業者の方から顧客管理について相談を受けた。過去の予約や問い合わせの電子メールデータが破損したので復旧したいというのが発端だったが、そこから、これら日々蓄積されるデータを有効に活用する手段について話題が発展した。つまり、データマイニングによるマーケティングの実践となる。データマイニングの前提条件の一つとして「大量データ」が挙げられるが、電子媒 体での情報集積が日常化している現在では、企業規模の大小に係わらず獲得可能となってきている。

 そこで今回は、データマイニングの方法論として注目されている「CRISP-DM」を紹介する。

 CRISP-DMは、CRoss-IndustryStandardProcessforDataMiningの略語である。業界、業務分野のそれぞれに中立なデータマイニング用の方法論として、SPSS、NCR、DaimlerChrysler、OHRAがメンバーとなっているコンソーシアムにより開発された。2000年にhttp://www.crisp-dm.org/においてVersion1.0が公開されている。このドキュメントにおいてデータマイニングプロジェクトの手順を具体的に明示し、各工程の作業を明確に定義している。手順(各フェーズ)はライフサイクルとして図のように表現されている。

 フェーズ1(BusinessUnderstanding)ビジネスの視点で、データマイニング・プロジェクトがどんな役割を果たすのかを明確にする。

 フェーズ2(DataUnderstanding)分析に利用するデータを収集し、ビジネス目標の達成に必要十分な内容か吟味する。

 フェーズ3(DataPreparation)欠損値・外れ値処理、データ型の整備、正規化などの前処理を行う。

 フェーズ4(Modeling)利用可能なモデリング手法とアルゴリズムから適切なものを選択し、モデルを作成する。

 フェーズ5(Evaluation)フェーズ1で定義したビジネス目標を達成できるモデルとなっているか、ビジネスの視点で評価する。

 フェーズ6(Deployment)データマイニングの分析結果をビジネスに適用する具体的なプランニングを行う。

 ビジネス目標の規模の違いに係わらず、データマイニングを進める場合に上記方法論に沿っていくことにより、正しい実践・知識の再利用・有効性のチェックを効率的に実現可能となる。 (「観光とけいざい」第682号05年7月15日号)


 |  連載27 |  HOME |
本ホームページに掲載の記事・写真の無断転載を禁じます。すべての著作権は沖縄観光速報社に帰属します。
Copyright (c) 1996 Okinawa Kankou Sokuhousya. No reproduction or republication without permission.