MachineLearning

1/103ページ

[TensorFlowで株価予想] 3 – 日本3506銘柄の株価予想ランキング

TensorFlowで株価予想シリーズ 0 – Google のサンプルコードを動かしてみる 1 – 終値が始値よりも高くなるかで判定してみる 2 – 日経平均225銘柄の株価予想正解率ランキング〜 3 – 日本3506銘柄の株価予想ランキング 4 – 実際に売買したら儲かるのかシミュレーションしてみる 5 – 大きく上がると予想されたときだけ買ってみるシミュレーシ […]

Coursera / Machine Learningの楽しみ方 (Week 10)

(ベンチマークテストに関して,追記しました.) 先日,Coursera, Machine Learning コース (by Stanford University, Prof. Andrew Ng) のプログラミング課題(Matlab)をPythonに移植しながら楽しむ方法についてQiitaに投稿させていただいた.その後コースの受講も進んだが,Week 10から楽しみにしてきたプログラミング課題が無いことを知った.(全11週の内,Pro […]

Caffeを初めてインストールして、画像を分類させてみようとした(失敗)

二週間前から本格的に機械学習の勉強を始めました。まだまだですが、理論的なところはざっとなぞったので、まずは手元のPCに動くものを入れてみようと言うところです。 Caffeは画像に特化したDeep Learning のフレームワークです。 ** この投稿は、結局うまくいかなかったという話です。その過程の備忘録 ** (追記) そもそも Macにcaffe入れようとするのが間違っているのか… ? 目標 Caffeのインストール […]

大量のニュースから興味関心のある話題をベイジアン分類で抽出する

前々回はニュースデータを収集するために RSS/Atom フィードを利用する話を書きました。 RSS/Atom フィードには全文配信と要約配信があり、昨今ではページビューを稼ぐため要約配信、特にリンクがリダイレクトになっているものや、本文がカラのものが多いという話をしました。 全文配信 … タイトル、リンク、それに記事本文全体を含むフィード 要約配信 … タイトル、リンク、記事の一部のみまたは本文がカラのフィード フィードデータをためる […]

ベイズ線形回帰(PRML§3.3)の図版再現

ご挨拶 今日から始まりました Machine Learning Advent Calendar 2013 幹事の @naoya_t です。今年もよろしくお願いします。 (日本時間では日が変わってしまいました。大変遅くなり申し訳ございません。アルゼンチン標準時(GMT-3)にはぎりぎり間に合いました!) このアドベント・カレンダーの記事内容は、パターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関する事でしたら何で […]

OCamlとSLAPで作る型安全ニューラルネット(と深層学習)

この投稿は Machine Learning Advent Calendar と ML Advent Calendar の18日目の記事です. 今日は関数型プログラミング言語 OCaml と線形代数演算ライブラリ SLAP を使った型安全なニューラルネットワークの実装について書きたいと思います.最近,深層学習とかいうニューラルネットの応用が流行っていますし,一方で,関数型プログラミング言語とかいうのも流行っているので,2つの流行に(むり […]

データ分析において必要なことを原点に立って考えてみる

今日は統計や技術の詳細な話は少しお休みして、そもそもデータマイニングとは何なのか、分析において必要なことは何なのかを考えてみます。 仮説力とは何なのか データ分析の実務においては、分析モデルの手法や統計的方法の前にまず検討しなければならないことが多々あります。たとえば分析対象の問題をどのように設定するか、対象の特徴 (= 属性、振る舞い等) をどのように表現するか、何を可視化するかあるいはそれをどう決めるか、ログなどを用いて特徴の計算方 […]

C-SVMのチューニング(正則化パラメータの最適化)

はじめに C-SVMのチューニングでは,正則化パラメータ($C$)の最適値をCross Validationで求める方法が提案されています. 本エントリーでは,pythonのscikit-learnを使って,SVMのクラス分類に必要な$C$を最適化する方法を紹介します. SVMの損失関数は,データ数に依存して変化するため,データ数のスケーリングによって,$C$の最適値を評価する必要があります. 正則化(Regularization) S […]

R超入門 – Rのインストールから決定木とランダムフォレストによる分析まで

概要 Rは対話的にデータ分析をおこなうことに適したプログラミング言語であり、それに加えてデータの可視化などのパッケージも含むデータ分析の「スイート」と言えます。 この記事ではまだRに触れたことがないユーザーが、Rの基本を解説しつつ、決定木およびランダムフォレストと呼ばれるアルゴリズムを用いた予測モデルを作成する手順までをチュートリアル形式でカバーしていきます。 このチュートリアルを終えると、構造化データの統計を瞬時に算出できるようになり […]

🌲🌲 Python でランダムフォレストを実装する男 🌲🌲

モチベーション ディープラーニングにあらずんば人工知能にあらずな世の中でも、画像解析や自然言語処理などの非構造データではない、従来通りの構造データに限れば、古きよき機械学習手法はまだまだ手軽かつ高い精度を叩き出す。 例えばサポートベクターマシン、ロジスティック回帰、そしてランダムフォレスト 「でもランダムフォレストってパッケージを使ったことはあるし動作原理もなんとなく知ってるけど、実装したことはないな」 モチベーション完成 ランダムフォ […]

1 103