岡嶋裕史『数式を使わないデータマイニング』

「紙おむつとビール」の伝説
従来型の統計分析が、規定した法則の事後検証を指向しているのに対し、データマイニングは多分に未来予測指向である。
饅頭とみかんとお茶
複数の分析手法を使いこなす
 分類(クラスター分析、決定木分析、自己組織化マップ)
 関連発見(連関規則)
 予測(回帰分析、ニューラルネットワーク
回帰分析
 (牛乳の飲用量と身長、最小二乗法)
決定木
 (デートに誘う、オッカムの剃刀
クラスタ分析
 (HR図、葡萄の実、ガンダムモビルスーツ
自己組織化マップSOM Self-organizing maps、コホーネンネット
 (軍機、多次元データを二次元に圧縮する、入力層と出力層、カフェ(値段、店舗数、スタイル)
連関規則
 (買い物のかごの中身は?「Aが起きると、Bが発生する」、バスケット分析、ヨーグルトとはちみ つ、アマゾンが競争力の源泉とし、収入を得る糧にしているのは、データマイニングによって得ら  れた分析結果である。グーグルの本質も検索エンジンではない)
ニューラルネット
 (花粉が飛ぶ、窒素化合物、閾値、食生活が乱れている、教師あり学習ニューロン同士の結合、交 差妥当化)
データマイニングと情報管理
 おじいちゃんのお見舞い
OECDのプライバシーガイドライン
 収集制限の原則
 データ内容の原則
 目的明確化の原則
 利用制限の原則
 安全保護の原則 
 公開の原則
 個人参加の原則
 責任の原則
今日、社会システムとはすなわち情報システムである。