内容説明
データの中に隠れた問題を見つけ出す。問題のあるデータの様々なパターンを紹介し、その対処法を解説。
目次
はじめに:バッドデータとは何か?
気のせいかな。このデータ、何かおかしくないか?
機械ではなく人間が使うことを意図したデータ
プレーンテキストに潜むバッドデータ
Webにあるデータの(再)構成
オンラインレビューから嘘つきと混乱した人を発見する
バッドデータは起立して
血と汗と尿
データと現実が一致しないとき
バイアスとエラーの源
最善は善の敵、バッドデータは本当にバッドなのか?
ファイルにこだわる
Crouching Table,Hidden Network
クラウドコンピューティングの神話
ソーシャルメディア:消去可能インク?
データ品質分析の解明:データが十分良いときを知る
著者等紹介
マッカラム,Q.イーサン[マッカラム,Q.イーサン] [McCallum,Q.Ethan]
プロフェッショナルサービスコンサルタント、作家
磯蘭水[イソランスイ]
株式会社X‐Listing勤務。広告配信システムのアーキテクチャ、配信最適化のための大規模データ処理、分析システムの構築等を中心に、エンジニアチームのディレクションまで行う
笹井崇司[ササイタカシ]
ソフトウェアエンジニア。大阪大学大学院工学研究科情報システム工学専攻修了。現在、電機メーカーに勤務(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
デコボコ
5
第4章「プレーンテキストに潜むバッドデータ」2016/09/29
majiro
5
こういう本が普通にどんどん出てくる時代になった。それを最初から電子書籍で読めて物理的なスペースを必要としない時代になった。みーんながみんな、Unix Magazineのバックナンバーを書棚に並べていた頃のことを、ちょっと思い出した。おセンチメートル!2013/10/26
h t
2
データもいろいろあんのね2013/12/22
ななみ
2
よく言えば多種多様、悪く言えばごった煮のような本。現実のデータというのは決して整ってもいないし、完全でもない。一貫性もない。それを捨ててしまうのではなく、データの本質を見つめ、理解することでしゃぶり尽くそうという思想かな。副題にある「処方箋」という言葉がすごく本質的かも。ごった煮のような本書は、その内容が説くとおり、まさにバッドデータは使いよう!を地で行っているという感じ。2013/11/01
笠井康平
1
だんだんデータ自体の品質から離れた話が増えていくのは、ごく自然ななり行きだと思った。2019/01/04