岡嶋裕史『数式を使わないデータマイニング』
「紙おむつとビール」の伝説
従来型の統計分析が、規定した法則の事後検証を指向しているのに対し、データマイニングは多分に未来予測指向である。
饅頭とみかんとお茶
複数の分析手法を使いこなす
分類(クラスター分析、決定木分析、自己組織化マップ)
関連発見(連関規則)
予測(回帰分析、ニューラルネットワーク)
回帰分析
(牛乳の飲用量と身長、最小二乗法)
決定木
(デートに誘う、オッカムの剃刀)
クラスタ分析
(HR図、葡萄の実、ガンダムのモビルスーツ)
自己組織化マップSOM Self-organizing maps、コホーネンネット
(軍機、多次元データを二次元に圧縮する、入力層と出力層、カフェ(値段、店舗数、スタイル)
連関規則
(買い物のかごの中身は?「Aが起きると、Bが発生する」、バスケット分析、ヨーグルトとはちみ つ、アマゾンが競争力の源泉とし、収入を得る糧にしているのは、データマイニングによって得ら れた分析結果である。グーグルの本質も検索エンジンではない)
ニューラルネット
(花粉が飛ぶ、窒素化合物、閾値、食生活が乱れている、教師あり学習、ニューロン同士の結合、交 差妥当化)
データマイニングと情報管理
おじいちゃんのお見舞い
OECDのプライバシーガイドライン
収集制限の原則
データ内容の原則
目的明確化の原則
利用制限の原則
安全保護の原則
公開の原則
個人参加の原則
責任の原則
今日、社会システムとはすなわち情報システムである。