Take Your Time

仕事や研究、コンピューターとの付き合い方

Rへの回帰[R][Python]

最近、Rに回帰している。Rには不満がたくさんある。 - デバッグがつらい(Python比) - {}をたくさん書かなきゃいけない(同上) - クラウドとの接続が悪い。AWSせよGCPにせよnotebookはボタン一つで立ち上がるサービスが提供されているがRStudio-serverは環境構築がめんどくさい(同上) - ドキュメントが少ない(同上)

にもかかわらず、データを手元においたあとはRに頼ってしまう。やはりdplyr, ggplotは強い。あと、pandasは実はメモリ食いかつ遅く、data.tableのfreadのほうが早いしメモリも食わない。 また、パイプでガンガン繋いで行くスタイルが試行錯誤が必要な分析にあっている。 ネックなのはPythonでデータ抽出、Rで分析となるのでファイルが分断されよくわからなくなる。これをしっかりgithubu管理、readme更新ができれば最強なのだろう