エンジニア選書<br> MLflowで実践するLLMOps―生成AIアプリケーションの実験管理と品質保証

個数:
  • ポイントキャンペーン

エンジニア選書
MLflowで実践するLLMOps―生成AIアプリケーションの実験管理と品質保証

  • ウェブストアに46冊在庫がございます。(2026年04月28日 21時09分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 376p/高さ 24cm
  • 商品コード 9784297155735
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

本書は、LLMアプリケーションの開発・運用に必要な一連のプロセス――観測可能性の確保、品質評価、プロンプト管理、本番展開――を、オープンソースプラットフォーム「MLflow」を使って体系的に実践する技術書です。
LLMアプリケーションは、従来の機械学習システムとは異なる難しさを持ちます。プロンプトのわずかな変更が品質に大きく影響し、エージェントの挙動は複雑で追跡が難しく、コストは見えにくい場所で膨らみます。MLflow 3はこうした課題に正面から向き合い、トレーシング、評価(LLM-as-a-Judge)、Prompt Registry、AI Gatewayといった機能を1つのプラットフォームに統合しました。
本書では、シンプルなLLMアプリケーションから始め、RAGシステム、マルチエージェントまで段階的にカバーしています。実際に動くPythonコードとともに、「作って終わり」ではなく「運用し続けられる」LLMアプリケーションの構築方法を提供します。


【目次】

第1章 LLMOpsの世界へようこそ
1.1 なぜ今LLMOpsが必要なのか
1.2 従来のMLOpsとLLMOpsの決定的な違い
1.3 MLflowが解決するMLOps/LLMOpsの課題
1.4 本書の構成と読み方ガイド
1.5 まとめ

第2章 MLflowとは
2.1 MLflowの進化を知る
2.2 MLflow以前の機械学習プロジェクトにおける課題(~2018年)
2.3 MLOpsプラットフォームとしてのMLflowの誕生・発展(2018~2022年)
2.4 LLMのブレークスルーと課題の変化(2023~2024年)
2.5 MLflowの誕生(2025年)
2.6 まとめ

第3章 MLflowのインストールと初期設定
3.1 前提条件の確認
3.2 サンプルプロジェクトのセットアップ
3.3 サービスの設定とエージェントのテスト実行
3.4 応用(1):OpenAI以外のLLMを使用する場合
3.5 応用(2):より高度なTracking Serverの設定
3.6 応用(3):マネージドMLflowの活用
3.7 まとめ

第4章 可観測性の確保──トレーシングの導入
4.1 可観測性・トレーシングとは
4.2 LLMアプリケーションにおけるトレーシング
4.3 トレーシングを有効にする
4.4 MLflow QAエージェントへのトレーシング導入
4.5 トレースに追加情報を付与する
4.6 トレーシングの仕組みと実装
4.7 応用(1):TypeScriptアプリケーションのトレーシング
4.8 応用(2):トレースの検索
4.9 応用(3):OpenTelemetryとの連携
4.10 応用(4):並行実行とスレッド安全性
4.11 まとめ

第5章 改善サイクルを加速する ──評価の仕組み
5.1 LLMアプリケーションの品質保証の難しさ
5.2 評価の始め方:まずは実際に動かしてみる
5.3 ドメイン専門家によるレビュー
5.4 評価基準を決定する
5.5 評価データセットの準備
5.6 自動評価の実行
5.7 応用(1):会話セッションのシミュレーションと評価
5.8 応用(2):LLMジャッジのアライメント
5.9 応用(3):サードパーティ評価ライブラリとの連携
5.10 まとめ

第6章 プロンプトエンジニアリング──プロンプトの運用と管理
6.1 プロンプト管理の課題とPrompt Registryの価値
6.2

内容説明

LLMアプリケーションをプロトタイプで終わらせないMLflow 3で実現する観測・評価・運用の基盤。AIエージェント開発を軸に、MLflowの主要機能を実践的に習得。トレーシングで障害の原因を可視化し、デバッグ時間を大幅削減。LLM‐as‐a‐Judgeと自動評価パイプラインで品質を定量管理。Prompt Registryでプロンプトをバージョン管理し、改善を追跡。本番デプロイからコスト・品質のリアルタイム監視まで1冊で完結。

目次

第1章 LLMOpsの世界へようこそ
第2章 MLflowとは
第3章 MLflowのインストールと初期設定
第4章 可観測性の確保―トレーシングの導入
第5章 改善サイクルを加速する―評価の仕組み
第6章 プロンプトエンジニアリング―プロンプトの運用と管理
第7章 本番環境で動かす―サービングとデプロイメント
第8章 監視と運用―LLMアプリケーションの健全性管理
第9章 実践ケーススタディ
第10章 エンタープライズ環境でのMLflow活用
第11章 LLMOpsの未来とベストプラクティス
付録A MLflow CLIリファレンス(LLM関連)
付録B トラブルシューティングガイド
付録C 用語集

著者等紹介

弥生隆明[ヤヨイタカアキ]
大手製造業にてインフラ管理・システム開発、大手ITメーカーにて自然言語処理の研究開発・ITコンサルティング・サービス開発運用・海外赴任を経て、外資系コンサルティングファームでデータ分析プロジェクトに従事。現在はDatabricks Japanにて、生成AIおよびデータエンジニアリングを専門にDatabricksの導入支援に取り組む。2026年4月より青山学院大学特別研究員を兼務。興味・得意分野は生成AI、データエンジニアリング、Webアプリ、Databricks

渡辺祐貴[ワタナベユウキ]
Amazon Japanにて機械学習エンジニアとして従事したあと、現在はDatabricksにてオープンソースMLflowのテックリードを務め、LLMOps領域の開発を推進している。とくにLLMアプリケーションの可観測性および評価機能の設計・開発をリードし、MLflowのGenAI対応を牽引。興味・得意分野は機械学習・AI、プラットフォーム開発

大内山浩[オオウチヤマヒロシ]
大手外資系ITメーカーにてソフトウェア開発や戦略コンサルティングに従事。その後、大手外資系ソフトウェアベンダーにてクラウドを活用したデータ・AI導入を推進し、大手半導体メーカーではAIスペシャリストとして技術営業やエバンジェリズム活動に携わる。現在はDatabricks JapanにてAI領域の専門家として企業のAI導入・活用支援に取り組む。専門学校の教育顧問も兼務。興味・得意分野はAI、クラウドアーキテクチャ、データ活用戦略

平田東夢[ヒラタトウム]
Databricksソフトウェアエンジニア。大学院で深層学習を用いた動画認識などの研究をしたあと、Indeed Japanで広告モデルの分析や推薦システムの開発を行う。DatabrickではMLflowやAIエージェントフレームワークDSPyの開発に従事。興味・得意分野は機械学習、因果推論、統計

河村春孝[カワムラハルタカ]
Databricksソフトウェアエンジニア。元データサイエンティスト。業務内でMLflowを利用していたことをきっかけに2019年にMLflowへのコントリビューションを開始。2020年にDatabricksに入社し、メンテナーとしてプロジェクトの開発・発展に取り組んでいる(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品