RStudioでデータの利活用
世界中のデータサイエンティストがバイリンガルで利用しているオープンソースR/Python。RStudio社は、データサイエンティストの用途に応じた開発環境の使い分けをストレスなく行うことができるよう、サービスを開発、提供し続けています。
具体的にデータマイニングを進める手順をもとに、お役立ち機能&パッケージを紹介します。

データの分析&探索
データの分析&探索のパッケージコレクション:tidyverse


データの可視化:ggplot2
説得力のあるデータの可視化に役立ちます

データの変換:dplyr
観測データの選び出し、行の並び替え、欠損値の扱い等、データの要約作業に 役立ちます

データの整理:tidry
データフレームを広げたり、分割、結合等、データフレームの成型に 役立ちます

イテレーション:purrr
コピー&ペーストせずに、コードの重複をなくすための、ループ処理に 役立ちます

文字列の扱い:stringer
文字列の長さ調整、結合、抽出等に 役立ちます

カテゴリカル変数:forcats
カテゴリカルなfactor型(月・火・水・木・金・土・日)等の水準を指定して並びを変えるのに 役立ちます
評価&共有


ドキュメントを作成:rmarkdown
再現性のある分析の為、RStudio上での分析からレポート作成に 役立ちます
モデルの作成

tidymodels
モデル作成における各種ライブラリの提供

Tensor Flow
機械学習のライブラリをRStudio上で利用できます

Sparklyr
ビックデータに対して高速に分散処理を行うことができるApacheSparkをRStudio上で利用できます
おすすめのライブラリ


Rコード変換:plumber
短いコードで RでwebAPIを提供することができます

データベースとの連携: Databases usingR
ODBCを用いてRからDBへの接続を行うパッケージ です
有料の商用ライセンスなら「Professional Drivers」が搭載され、データベース接続用のODBCデータコネクタが含まれよりセキュリティを考慮しています。
