2017-12-25 待ち時間を作らない分析 仕事 データ 分析技術 大規模なデータセットを分析していると、得てして勿体無い精神でできる限りたくさんデータを使おうとしてしまうのが人間の性である。しかし実際は簡単な分析に何ギガものデータセットは不要で、サンプル抽出して分析すれば事足りることも多い。大規模データを扱うことの欠点は、時間がかかるということである。計算を回すたびに5分も10分も休憩しているようではいつまでたっても分析は進まない。待ち時間は長くて数分。通常は数秒に抑える。コンピュータに時間はあげない。俺が考える時間が優先。