RStudioでデータの利活用

世界中のデータサイエンティストがバイリンガルで利用しているオープンソースR/Python。RStudio社は、データサイエンティストの用途に応じた開発環境の使い分けをストレスなく行うことができるよう、サービスを開発、提供し続けています。

具体的にデータマイニングを進める手順をもとに、お役立ち機能&パッケージを紹介します。

RStudio

データの分析&探索

データの分析&探索のパッケージコレクション:tidyverse

データの可視化:ggplot2

説得力のあるデータの可視化に役立ちます

データの変換:dplyr

観測データの選び出し、行の並び替え、欠損値の扱い等、データの要約作業に 役立ちます

データの整理:tidry

データフレームを広げたり、分割、結合等、データフレームの成型に 役立ちます

イテレーション:purrr

コピー&ペーストせずに、コードの重複をなくすための、ループ処理に 役立ちます

文字列の扱い:stringer

文字列の長さ調整、結合、抽出等に 役立ちます

カテゴリカル変数:forcats

カテゴリカルなfactor型(月・火・水・木・金・土・日)等の水準を指定して並びを変えるのに 役立ちます

評価&共有

インサイトの共有:Shiny

簡単にwebアプリケーションを作成に 役立ちます

ギャラリーはこちら

ドキュメントを作成:rmarkdown

再現性のある分析の為、RStudio上での分析からレポート作成に 役立ちます

モデルの作成

tidymodels

モデル作成における各種ライブラリの提供

Tensor Flow

機械学習のライブラリをRStudio上で利用できます

Sparklyr

ビックデータに対して高速に分散処理を行うことができるApacheSparkをRStudio上で利用できます

おすすめのライブラリ

Pythonとの連携:reticulate

RからシームレスにPythonを呼び出すことができます

RStudio上でPythonを利用する方法はこちら

Rコード変換:plumber

短いコードで RでwebAPIを提供することができます

データベースとの連携: Databases usingR

ODBCを用いてRからDBへの接続を行うパッケージ です

有料の商用ライセンスなら「Professional Drivers」が搭載され、データベース接続用のODBCデータコネクタが含まれよりセキュリティを考慮しています。

RStudio Professional Driversについて

ダッシュボードの作成:flexdashboard

rmarkdownでよりインタラクティブなダッシュボードの作成が可能です

ダッシュボードのサンプルはこちら