出版社内容情報
本書は、ChatGPT や Gemini といった生成AIが、人間の代わりにアプリやWebブラウザを操作する「実行型AI(AIエージェント)」の仕組みと実践方法を、基礎から段階的に解説した一冊です。
Chapter1 では、AIが「文章を返す存在」から「PCを操作する存在」へと進化した背景を整理し、Computer Use という新しいAIの役割が、私たちの仕事や開発スタイルをどのように変えるのかを概観します。
Chapter 2では、ChatGPT の Apps inside 機能を取り上げ、アプリの追加や基本設定、プロンプト設計など、実際に使い始めるための基礎を解説します。
Chapter 3・4では、Apps inside 向けのアプリを Node.js および Python で開発する方法を詳しく紹介し、MCPサーバーの構築から Gradio を用いたUIアプリ作成まで、実践的な開発フローを学びます。
Chapter 5 では、Google の Gemini に焦点を当て、Pythonからの利用方法や、生成AIとしての特性を整理します。
Chapter6では、Gemini Computer Use と Playwright を組み合わせたブラウザ操作エージェントの実装を通じて、AIがWebを自律的に操作する高度なワークフローを体験します。
対象読者
? 実行型AI・AIエージェントに興味がある方
? ChatGPT / Gemini を「使う側」から「動かす側」へ進みたい方
? ブラウザ操作・業務自動化・AIワークフローを実装したいエンジニア
【目次】
Chapter 1 AIが“PCを動かす”時代
Chapter 2 「Apps inside」のアプリを使いこなそう
Chapter 3 Apps insideアプリの開発
Chapter 4 PythonによるApps insideアプリ開発
Chapter 5 Geminiを活用する
Chapter 6 Gemini Computer Useを利用する
-
- 洋書
- Tell Her Yes



