検索エンジン自作入門―手を動かしながら見渡す検索の舞台裏

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 222p/高さ 21cm
  • 商品コード 9784774167534
  • NDC分類 547.48
  • Cコード C3055

内容説明

GoogleやYahoo!の裏側にはどのようなしくみがあるのか?ソースコードで原理を深く理解する。

目次

第1章 検索エンジンはいかにして動くのか
第2章 全文検索エンジンのサンプルを準備する
第3章 転置インデックスを作ろう
第4章 検索しよう
第5章 転置インデックスを圧縮しよう
第6章 wiserの改良やパラメータの調整に挑戦してみよう
第7章 これからより深く学ぶために
付録

著者等紹介

山田浩之[ヤマダヒロユキ]
日本アイ・ビー・エム株式会社を経て、ヤフー株式会社にて分散型全文検索エンジンの研究開発に従事。2008年上期未踏IT人材発掘・育成事業において高性能分散型検索エンジンの開発によりスーパークリエータに認定。現在は東京大学生産技術研究所にて高性能並列データベースの研究開発に従事。博士(情報理工学)

末永匡[スエナガタスク]
Tombo,Inc./株式会社wktk所属。長崎県出身。ブログ検索サービスの担当となり、はじめて検索エンジンに触れる。オープンソース検索エンジンSennaへのパッチ投稿をきっかけに、検索エンジンSenna/Groongaの開発に携わる(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

えちぜんや よーた

65
形態素解析に関する具体的な事例がのっているか期待して読んでみた。が、残念ながらそれほど紙面が割かれているわけではなかった。形態素解析については、概要をさらりという程度。残念ながら個人的なニーズを満たすことはかなわず。本気で検索エンジンを作りたい人にどうぞ。2014/11/14

501

10
検索エンジンの要の技術である転置インデックスを中心に概念からソースコードまで落とし込んで解説する。ソースは検索エンジンに最低限必要な機能を備えている本書用作成されたwiserで解説され、さらにパラメーターを変更することで挙動の変化を確認できるようになっている。言語はC言語なので、検索エンジンに興味があり、C言語が読める書けるの人には刺激的な本。2016/11/15

nashcft

2
転置インデックスの作成と圧縮が要。その他サンプル用の実装を見ながら構造の解説があり、パフォーマンスや精度に関するトレードオフとなるポイントを解説している。入門とはいえかなり情報量はあるし、これを足がかりにしてどのような方向に進むべきかの指標もある。2015/01/10

Watabe Takayuki

1
全文検索は、「情報検索の手法としては、あくまで最後の非常手段である」ぐらいに、大げさに捉えましょう。「鶏を割くに焉んぞ牛刀を用いん」の精神です。2015/11/09

いけいけ

1
全文検索エンジンの理論的な仕組みから実装例の紹介まで。2014/11/24

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/8294171
  • ご注意事項

最近チェックした商品