5日目:R言語で統計


1回生の小村(sou)です。今回統計に強い(汎用性があまりない)と言われているR言語について紹介したいと思います。(文字ばかりですみません)

<処理・データの扱い>

スクリプト言語であるためやはり実行速度は遅いと言われていますが、他の統計用言語の中ではトップクラスです。組み込み型の関数を用いて実行速度を改善しています。ベクトル処理言語であるRは行列・ベクトル・配列・集合などの様々なデータを特に宣言せずとも簡単に使えます。データフレームと言われる行や列に名前をつけることもできるデータもあります。

<統計解析に役立つコマンド>

Rにはデフォルトで統計解析に役立つコマンドが多く用意されています。10万件などの大規模なデータを扱う場合目視で探すのは大変困難です。そんな時はsummaryを使いましょう、最大値・最小値・平均など基本情報を一括で表示してくれます。Excelなどのデータを扱いたい時はreadによって直接データを読み込むことができ、逆にwriteでExcelなどに書き出すことも可能です。欠損値(NA)などに対処するコマンドもあります。統計解析をする上で欲しい情報・操作を簡単に取得・実行するコマンドが豊富にあります。

<パッケージの導入>

通常の統計ではなく専門分野において統計解析を行いたい時があります(生物・経済・災害など)。このような場合はデフォルトでは対処できないこともあるので、パッケージを追加しましょう。パッケージはpythonでいうところのライブラリにあたります。IDEなどから直接ダウンロードできるのでインポートも容易です。

<R言語で予測>

統計の最大の特徴は予測です。解析したデータを元に事象の予測を行うことも多いです。予測は数式(モデル)を用いて数学的に行うもので方法も沢山存在します。AR・MR・ARMAなどなど様々ですが、基本的にどのモデルも用意されており状況に合わせて最適なモデルを選ぶこともできます。検証を行うコマンドも多く用意されており統計を行う上ではとても充実した環境です。

<最後に>

R言語について本当にざっくりと内容を説明しました。R言語は非常に統計に特化した言語ですが、統計という分野についての理解があってこそ真価を発揮します(統計は個人的には難しい学問だと思う)。統計に興味があるなら使われてみてはいかがでしょうか。

 

カテゴリー: 2017年度, アドベントカレンダー パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です