入門マルチモーダルRAG - 図表を読み解くAIアプリケーションの実装

個数:
  • 予約

入門マルチモーダルRAG - 図表を読み解くAIアプリケーションの実装

  • ご予約受付中
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【出荷予定日】
    ◆通常、発売日にウェブストアから出荷となります。
    ◆指定発売日のある商品は発売前日にウェブストアから出荷となります。
    ◆一部商品(取り寄せ扱い)は発送までに日数がかかります。

    【ご注意事項】 ※必ずお読みください
    ◆表示の発売日や価格は変更になる場合がございます。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
    ◆ご予約品は別途配送となります。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 176p
  • 商品コード 9784274234934
  • Cコード C3055

出版社内容情報

「図表を読めるAI」を作る
近年、テキストだけでなく、図や表やグラフといった画像を含む資料からも情報を検索・活用できる「マルチモーダルRAG(Retrieval-Augmented Generation)」の重要性が高まっています。従来のテキストベースRAGが扱える情報はテキストデータに限定されており、実務現場で扱う文書──技術報告書、研究論文、プレゼン資料──のように、図表を多く含むデータには十分対応できませんでした。本書は、この課題を踏まえ、実務文書にも対応できるマルチモーダルRAGについて体系的に解説します。
本書では、自分の手でマルチモーダルRAGを構築できるようになることを目指します。全体を通して、手を動かしながら理解できるよう、再現可能なコード例を多数提示しています。

<本書の構成>
・第1章:基本的な構成のRAG(データベース・検索器・生成器)をPythonで実装し、RAGの仕組みを理解します。
・第2章:画像をテキストに変換する方式と、画像とテキストを同一のベクトル空間に埋め込む方式という、2種類のマルチモーダルRAG の実装方法を紹介します。
・第3章:Embed-4やCLIP-RAG、反復型RAGといった最新手法を概観し、マルチモーダル知覚統合の潮流を整理します。
・第4章:特定領域の画像(医療画像、技術図面など)に特化したマルチモーダル RAG の構築を目指し、projectorやLLM、デュアルエンコーダのファインチューニング方法を実例とともに解説します。


【目次】

はじめに
目次

第1章 テキストベースのRAG
第2章 マルチモーダルRAG
第3章 マルチモーダルRAGの実装手法
第4章 特化型マルチモーダルRAG

おわりに
参考文献
索引

最近チェックした商品