Solr

1/7ページ

Sunspotでお手軽苦情検出

この記事はアクトインディ Advent Calendar 2015 1日目になります。 どうぞよろしくお願いします。 要旨 アクトインディの運営する子どもとお出かけ情報サイト いこーよでは、日々、おでかけスポットの口コミがユーザーから投稿されています。 中には、おでかけスポットへの苦情や不満が書かれた口コミがあります。 そういったものを早期に検出するためSolrの類似文書検索(MoreLikeThis)機能を使用し機械的な検出を試みまし […]

Watson Retrieve and RankをWebから使う

はじめに とあるハッカソンに参加した折、使う機会がありましたので、その時したことの備忘録となります。 最後までやると、学習済(?)の検索APIをWebから叩けるようになります。 (私のような)Bluemixも機械学習も触ったことがない、でもなんとなく試してみたい…という方でもなるべく苦しまないように、ファイルやコマンドの情報を色々と補完しました。 間違い・勘違い等ありましたらご指摘頂ければ幸いです。 [追記] ハッカソンの後に、Retr […]

SolrとランキングとRankQuery

この記事は Solr Advent Calendar 2016 の 25日目です。 今回はSolrのRankQueryについてテキトーに話します。 (なお、この記事の時点でのSolrのバージョンは6.3.0です) Solrとランキング Solrのランキングでは大きく分けて以下の3つのコンポーネントが関係します。 Query/Weight/Scorer 検索クエリからQueryParserを介して生成される部分 Query=>Wei […]

Solr による サジェスト検索実装

はじめに しばらくSolrに触らないうちにサジェスト検索コンポーネントが追加され、以下のような機能が実装されていたので試してみました。 複数辞書への問い合わせ 指定した重みによるソート 指定したフィールド値によるフィルタリング 実験環境構築 https://github.com/ft28/practice/tree/master/solr/suggest の README.md に従うと以下の実験環境を構築出来ます。 環境構築が完成する […]

形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法

この記事はVASILY DEVELOPERS BLOGにも同じ内容で投稿しています。よろしければ他の記事もご覧ください。 こんにちは、バックエンドエンジニアの塩崎です。 今まではiQONの全文検索用のインデックスには形態素解析だけを用いていましたが、先日Ngramも併用することで検索を改善しました。 その結果、検索結果のヒット数が向上し、なおかつ検索ノイズの増加を軽微なものに抑えることができました。 この記事では、Ngramを併用するこ […]

Debian wheezyでsolr-jettyを使う

いきなりなんですが、solrが何ぞっていうのはちょっと置いておいて、ここではsolrをjettyの上で動かすパッケージをインストールしてみます。(solrの使い方とかはまたいつか書きたい) 利用するのはDebian wheezyを利用します。squeezeまでは存在していませんでしたが、このバージョンではどうでしょうか。まともに使えるんでしょーか? (ちょっと補足すると、jettyはサーブレットコンテナ、solrはjavaのwebアプリ […]

[Apache Solr] Jettyについて

Apache Solr Apache Solr は デフォルトでJettyがサーブレットとしてついています。 Tomcatに変える人もいるようですが、Jettyもなかなか性能がいいようなので、 Jettyについて調べたことのメモです。 Jetty とは Jetty は、100%Javaで開発されたJava Servletコンテナ/Webサーバである。WebSocketなどのプロトコルもサポートする。Jetty はオープンソースプロジェク […]

Zoomdataを試してみよう(ビッグデータ編:2)

ビックデータ編:1では、Cloudera Impalaとの接続検証を、Cloudera社が公開している仮想イメージを活用させて頂く事で実際の手順を含めてご紹介致しました。 今回は、その環境設定の際に見つけたSolr Searchについて同様に接続検証を行いたいと思います。 (1)接続設定 まずは、いつもの通りadminでZoomdataに入り、歯車アイコンのSources画面を出します。 Solrのアイコンが有りますので、それを選択しま […]

1 7