課題感
様々な分析しごとをどうオーガナイズするかめちゃくちゃになっているのでルールを決めたい。
現状
研究
- jupyter notebookかRmarkdownで実施。コードを書く前に動作を確認したいときはSQLミドルウェアも使う。
- Pythonコードはgithubで管理。
- 最近あまりやっていないがJuliaもgithub
- 報告についてはスライドを作成するか、Rmarkdownそのまま
- 社内打ち合わせはjupyterでやってしまうことも多い。
- 日報的な感じでesaを使っている。論文の概要とかはesa
- 最終アウトプットはoverleaf
- 紙のノートも使う。特にうだうだ考えたり計算したりモデル書いたりするとき。
分析
- jupyterかRmarkdown
- 報告のときはスライド
問題点
- 正直どれを使うか迷う。
- そしてあとから見返すときにどこに何があるかわからない。
- スライドを作成するのが億劫(ただし、どこに何があるかわかっていればそれほど辛くはない)
- スライドがダサい
- esaの使い所がわからないが、社内共有にはこれしかない
- ちょっとしたアイデアを書く場所がない。
考慮すべき点
- jupyter, Rmdは離れられない。
- jupyter, Rmdはメモ的な扱いにしたいが、あとから検索可能性が上がるようにしたい。
- どこにあげるかを決めたい。
- esaの共有性をどうするか
- データ→分析メモ→アウトプットを円滑に進めたい
- 一人仕事と複数人仕事で状況が変わる。
新ルール(仮)
- とっかかりはrmdかjupyter。
- 検索可能性が上がるようにproject毎にまとめる。
- projectごとにレポジトリを作る
- 作業のおおまかな計画的なやつはreadmeを更新していく。タスク管理はgithubのissueを使う
- rmdもjupyterもファイル名に日付をいれる。"[prjname]_20190201.{Rmd|ipynb}"
- 日付ごとに作り直す。
- esa, google suit, overleafは用途に応じてメモからつくる
- 社内向けや時間がない場合はjupyterはcolaboratoryに変換してシェア。rmdはpdfにする
一旦これでやってみる。