Python

2/1360ページ

Caffeを初めてインストールして、画像を分類させてみようとした(失敗)

二週間前から本格的に機械学習の勉強を始めました。まだまだですが、理論的なところはざっとなぞったので、まずは手元のPCに動くものを入れてみようと言うところです。 Caffeは画像に特化したDeep Learning のフレームワークです。 ** この投稿は、結局うまくいかなかったという話です。その過程の備忘録 ** (追記) そもそも Macにcaffe入れようとするのが間違っているのか… ? 目標 Caffeのインストール […]

オンライン分類器の比較

動機 前回書いた通り、会社内にデータは全く貯められていない状態です。ですが、将来ログをまともに取得した場合のデータは膨大になることが想定されました。そこで、(時間/空間)計算量を考慮するとオンライン学習アルゴリズムを使うのが最良と判断しました。 (以前のpostも想定しての話を書いています。いろんな意味で残念ですね…orz) 今までオンライン分類器をまともに使った事がなかったため、性能評価も兼ねていくつかの分類器を試してみた […]

scikit-learnとgensimでニュース記事を分類する

こんにちは、初心者です。 適当なニュース記事があったとして、ニュースのカテゴリを推測するみたいな、よくあるやつをやってみました。Python3.3を使いました。 何をやるの? データセットはlivedoorニュースコーパスを使いました。 http://www.rondhuit.com/download.html クリエイティブ・コモンズライセンスが適用されるニュース記事だけを集めてるそうです。 トピックニュース、Sports Watch […]

TensorFlowでDQNを実装(したかった・・・)

下記のような記事を読み、DQN(Deep Q-Network)って面白そうだな~と感心。最近話題のAlpha-GoもDQNの延長・・・なのかな?(よく分かってない) DQNの生い立ち + Deep Q-NetworkをChainerで書いた 倒立振子で学ぶ DQN (Deep Q Network) Chainerで機械学習と戯れる: 足し算ゲームをChainerを使って強化学習できるか? そんなわけで、TensorFlowで実装してみよ […]

Theano の 基本メモ

ブログ投稿の続きとして、スライドに書けなかったTheanoの細かい部分についてもう少しまとめておこうと思います。 まず、Theano 解説 はTheano特徴を簡潔に表現されているので、一読をオススメします。 ここでも書かれていますが、Theanoの特徴として、 実行時にCコードを生成してコンパイル GPUでの実行のサポート(要CUDA) 自動微分 などがあげられると思います。 Theanoの超簡略チュートリアル http://deep […]

ベイズ線形回帰(PRML§3.3)の図版再現

ご挨拶 今日から始まりました Machine Learning Advent Calendar 2013 幹事の @naoya_t です。今年もよろしくお願いします。 (日本時間では日が変わってしまいました。大変遅くなり申し訳ございません。アルゼンチン標準時(GMT-3)にはぎりぎり間に合いました!) このアドベント・カレンダーの記事内容は、パターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関する事でしたら何で […]

pandas + matplotlib による多彩なデータプロッティング

科学技術計算用言語としての Python そもそもなぜデータ分析などの科学技術計算を Python でやるのでしょうか。主に次の二点によります。 NumPy, pandas, matplotlib など豊富なライブラリが揃っている 汎用性の高いグルー言語として利用できる データフレームを利用した計算とそのグラフ描画 (プロッティング) のみであれば R のほうがどちらかといえば簡単かもしれません。しかし統計解析を汎用性の高い Pytho […]

処理の一部を C++ で実装する

NumPy や SciPy をはじめとする科学計算ライブラリは機能が豊富なだけでなく、インタプリタ言語とは思えないほど非常に高速に動作します。それもそのはずで、ソースコードを読めばわかるとおり、内部の実装においては C や Fortran といったコンパイル言語で書かれた枯れた機能を利用しています。 これらにならい Python や Ruby などで定期的に何度も呼び出す計算のうち、汎用性のあるものについては C/C++ といったコンパ […]

OpenCV-Python & Scikit-image -「必見『OpenCV-Python Tutorials』2」への追記

「OpenCV-Python Tutorials」についてもう少し訳してみましたので、OpenCV-Pythonバインディングとともに役立つライブラリである scikit-imageについても、あわせてリンクをつけてみました。 どちらも、Pythonでnumpyのデータ構造を使うライブラリなので、両者を組み合わせて使うことが可能です。 Scikit-imageが提供するもの  Scikit-imageの場合には、OpenCV-Pytho […]

🌲🌲 Python でランダムフォレストを実装する男 🌲🌲

モチベーション ディープラーニングにあらずんば人工知能にあらずな世の中でも、画像解析や自然言語処理などの非構造データではない、従来通りの構造データに限れば、古きよき機械学習手法はまだまだ手軽かつ高い精度を叩き出す。 例えばサポートベクターマシン、ロジスティック回帰、そしてランダムフォレスト 「でもランダムフォレストってパッケージを使ったことはあるし動作原理もなんとなく知ってるけど、実装したことはないな」 モチベーション完成 ランダムフォ […]