出版社内容情報
【目次】
内容説明
生成AIの出力を評価し、再現性・品質・安全性を確保する。正確な情報を提供できるか。出力結果にばらつきはないか。不適切な表現を制御できるか。存在しない事実を提示していないか。プライバシーの侵害につながらないか。実際に評価を行うサンプルコード付き。
目次
第1章 生成AIアプリケーションの評価の概要
第2章 生成AIアプリケーションの評価基盤モデルと評価アプローチ
第3章 基本的な評価メトリクス
第4章 評価メトリクスのツールによる評価の実際
第5章 生成AIアプリケーションのセキュリティ評価
第6章 AIエージェントの評価
第7章 生成AIアプリケーションのテスト・評価のその他のトピック
著者等紹介
松木晋祐[マツキシンスケ]
株式会社ベリサーブ 執行役員 研究開発管掌。AIQVE ONE株式会社 取締役CTO。独立系ソフトウェアベンダにて、テストオペレータから品質部門統括まで、ソフトウェアテストと品質保証にまつわるさまざまなロールを経験後、株式会社ベリサーブ/AIQVE ONE株式会社へ。ソフトウェア開発、QA/テストにまつわる先進技術推進、応用技術開発を担う部門を創設、運用。生成AIが組み込まれたシステムの品質保証技術、AI駆動開発に向けたプロセスQA技術の研究などを推進。また、AIQVE ONE株式会社ではゲーム分野へのAI4QA技術/製品開発などを企画、製品化を実現。AIとQAの掛け合わせで国内のさまざまな企業産業に向けた技術開発、提案を行なっている。社外活動に、東京電機大学CySec講師、テスト自動化研究会ファウンダー、ISO/IEC JTC1/SC7/WG26、JSTQB Technical Committee、W3C CSSWGコントリビューターなど(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。



