Take Your Time

仕事や研究、コンピューターとの付き合い方

分析、研究パイプラインを真面目に考える

課題感

様々な分析しごとをどうオーガナイズするかめちゃくちゃになっているのでルールを決めたい。

現状

研究

  • jupyter notebookかRmarkdownで実施。コードを書く前に動作を確認したいときはSQLミドルウェアも使う。
  • Pythonコードはgithubで管理。
  • 最近あまりやっていないがJuliaもgithub
  • 報告についてはスライドを作成するか、Rmarkdownそのまま
  • 社内打ち合わせはjupyterでやってしまうことも多い。
  • 日報的な感じでesaを使っている。論文の概要とかはesa
  • 最終アウトプットはoverleaf
  • 紙のノートも使う。特にうだうだ考えたり計算したりモデル書いたりするとき。

分析

  • jupyterかRmarkdown
  • 報告のときはスライド

問題点

  • 正直どれを使うか迷う。
  • そしてあとから見返すときにどこに何があるかわからない。
  • スライドを作成するのが億劫(ただし、どこに何があるかわかっていればそれほど辛くはない)
  • スライドがダサい
  • esaの使い所がわからないが、社内共有にはこれしかない
  • ちょっとしたアイデアを書く場所がない。

考慮すべき点

  • jupyter, Rmdは離れられない。
  • jupyter, Rmdはメモ的な扱いにしたいが、あとから検索可能性が上がるようにしたい。
  • どこにあげるかを決めたい。
  • esaの共有性をどうするか
  • データ→分析メモ→アウトプットを円滑に進めたい
  • 一人仕事と複数人仕事で状況が変わる。

新ルール(仮)

  • とっかかりはrmdかjupyter。
  • 検索可能性が上がるようにproject毎にまとめる。
  • projectごとにレポジトリを作る
  • 作業のおおまかな計画的なやつはreadmeを更新していく。タスク管理はgithubのissueを使う
  • rmdもjupyterもファイル名に日付をいれる。"[prjname]_20190201.{Rmd|ipynb}"
  • 日付ごとに作り直す。
  • esa, google suit, overleafは用途に応じてメモからつくる
  • 社内向けや時間がない場合はjupyterはcolaboratoryに変換してシェア。rmdはpdfにする

一旦これでやってみる。