R

1/36ページ

 Rの密度比推定パッケージdensratioをPythonから利用する

今回は2つのテーマが合わさった記事になっていまして、ひとつはPythonからRのパッケージを呼び出して利用する方法、もうひとつが密度比推定のRパッケージdensratioを使って異常検知をしてみる、という記事です。 Rはとても多くの統計手法のパッケージが公開されており(8000を超えてるとか)、PythonにはないものもRには存在したりするので、非常に魅力的です。しかし、Pythonに慣れている人は、データの前処理やグラフ描画は慣れ親し […]

Rのtensorを理解する

この記事はQiita 数学 Advent Calendar 2015の3日目の記事です。(後付け) さいきんTensorFlowが流行っているので、Rのtensorパッケージの内容を唐突に説明します。 tensorのことを何も知らない人にも、なるべく優しくします。 将来、相対論とか真面目にやりたい人には、ちょっといい感じかもしれません。 ライブラリ 次のライブラリを使用します。 install.packages("tensor") li […]

サービスのエンゲージメントをDAU/MAU比率で計測、可視化、予測まで5分でやってみた

SaaSのように、サブスクリプションをビジネスモデルとしている会社にとってはリテンション率並びに離脱率は死活的に重要なKPIですが、そうしたリテンション率が下がる、もしくは離脱率が上がって大変な状況になってしまうのを待つのではなく、そういった兆候を早いうちに読み取るために、サービスのエンゲージメントを理解することが非常に重要になります。そして、それを計るためのKPIとしてよく使われるのものに、DAU/MAU (Daily Active […]

RでStacking ー第二回:実践編ー

はじめに ※2017/01/11 関数修正しました(stacking_in_r_function.R) この記事は以下の記事の続きです。 RでStacking ー第一回:概念編ー 前回は概念に関して、まとめたので今回から、実際にRでStackingを実行していきたいと思います。 今回使ったRコードはGistにあげていますので参考にしていただければと思います。 https://gist.github.com/RottenFruits/5c […]

Rのニューラルネットパッケージ「neuralnet」を使ってみる

この記事はフロムスクラッチ Advent Calendar 2016の11日目の記事です。 最近はPythonでTensorFlowやChainerを使ってみることが流行っていますが、今回はあえてRのニューラルネットパッケージであるneuralnetを使ってみました。 公式リファレンスのneuralnet.pdfにあるサンプルコードを参考にします。 想定読者 ニューラルネットを勉強をしたことがある人 統計学の勉強をしたことがある人 Rを […]

RでStacking ー第一回:概念編ー

はじめに StackingはKaggle等のデータ分析コンペで優勝者に使われることがあるテクニックの一つです。 Stackingの狙いは主に精度の向上にあるのですが、以下の引用にもあるように、一般的には数十%の改善というよりは数%程度の微妙な精度の改善になるようです[1]。 In general, stacking produces small gains with a lot of added complexity – not wor […]

R で 巨大な Bayesian networks を扱う

R でベイジアンネットワーク Rでベイジアンネットワークをやる際に、少数のノードの場合はよいのですが、多数のノードによるネットワークを表現するためには、少し工夫がいるようでした。 以下のhoxo_mさんのエントリなどを参考にやっていましたが、特にノードの表現で巨大ネットワークでは難しいことがわかりました。 Rでベイジアンネットワークメモ 使うライブラリ R にはlibrary(deal)、library(bnlearn)などのライブラリ […]

RでKerasを使う(短歌手習い編)

概要 『新しき 年の始めの うれしきは 古き人どち あへるなりけり』  以前に{tensorflow}のPythonライブラリをimportする関数を用いることで、gensimを活用できるという記事を書きました。  これにより、R/RStudio上ですべてを管理したい/されたいRおじさん(重度なRユーザーを指す。女性でも「おじさん」と呼称するので、淑女の方々はご配慮いただきたい)のできる幅が広がったと言えます。  今回はさらにTenso […]

Azure Machine Learning の実行環境

Japan Taxiでは、Azure Machine Learningを機械学習の環境として用いていますが、様々な検証を様々なスケールで試していく中で、どういう計算機環境が使われているのか気になりました。 Azure Machine LearningにはRやPythonのスクリプトを実行する環境があるので、システム環境を調べることができます。 Azure Machine Learning が実行されているOSは? Sys.Info() […]

R & MXNetで衛星画像認識

MXNetって何? ディープラーニング界隈では古参ながら、最近話題急上昇になっている MXNet を使ってみました。 Rから使える、唯一のメジャーなディープラーニングフレームワークとして認知されており、Rユーザーにとっては貴重な存在です。ディープラーニングをRのワークベンチから呼び出したい場合にはほぼ一択という状況ですね。CMUで開発されていましたが、大学由来のライブラリにしては、対応ハードウェア(CPU&GPU)、対応言語(C […]

1 36