Pythonで学ぶ画像認識 機械学習実践シリーズ

田村雅人中村克行

インプレス

発売:2023/03/22

発行形態:書籍

ファイル:EPUB画像形式/111.1MB

ポイント:35pt

¥3,850( 本体 ¥3,500 )

商品詳細

※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。

近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。

表紙
本書の前提
目次
序章
第1章 画像認識とは?
第1節 画像認識の概要
第2節 コンピュータによる画像認識の仕組みを理解しよう
第3節 実社会で使われている画像認識アプリケーション
第4節 画像認識のための開発環境構築
コラム:画像認識とクラウドサービス
第2章 画像処理の基礎知識
第1節 画像データを読み込んで表示してみよう
第2節 画像に平滑化フィルタをかけてみよう
第3節 畳み込み演算を使った特徴抽出
第4節 アテンションを使った特徴抽出
コラム:海外で働くことをめざす方へ
第3章 深層学習を使う準備
第1節 学習と評価の基礎
第2節 深層ニューラルネットワーク
コラム:AIとエネルギー問題
第4章 画像分類
第1節 順伝播型ニューラルネットワークによる手法
第2節 畳み込みニューラルネットワークによる手法―ResNet18を実装してみよう
第3節 Transformerによる手法―Vision Transformerを実装してみよう
第4節 精度向上のテクニック
コラム:見えるメリットとデメリット
第5章 物体検出
第1節 物体検出の基礎
第2節 データセットの準備
第3節 CNNによる手法―RetinaNetを実装してみよう
第4節 Transformerによる手法―DETRを実装してみよう
コラム:画像生成AI
第6章 画像キャプショニング
第1節 画像キャプショニングの基礎
第2節 データセットの準備
第3節 CNN-LSTMによる手法―Show and tellを実装してみよう
第4節 アテンション機構による手法―Show, attend and tellを実装してみよう
第5節 Transformerによる画像キャプショニングを実装してみよう
コラム:スタンフォード大学のコンピュータビジョン研究者養成術
参考文献
索引
著者プロフィール
奥付

購入前の注意点

3Dセキュア導入とクレジットカードによるお支払いについて
・この書籍はKinoppy for iOS、Kinoppy for Android、Kinoppy for Windows または Kinoppy for Mac(いずれも最新版)でお読みください。
・電子書籍は会員サービス利用規約に則してご利用いただきます。
・海外会員様にはプレゼントを贈れません。

著者情報

田村雅人[タムラマサト]
2016年に東京大学大学院工学系研究科修士課程を修了し、(株)日立製作所に入社。パブリックセーフティ向け映像認識技術の研究開発に従事し、人物検出や追跡、人と物体の関係性検出など、映像監視に使われるAI技術を開発。2021年よりアメリカ・シリコンバレーにオフィスをおくHitachi America,Ltd.に出向し、世界トップレベルの研究者たちと映像認識技術の開発に従事

中村克行[ナカムラカツユキ]
2007年東京大学大学院新領域創成科学研究科博士課程修了。同年、(株)日立製作所中央研究所入社。物体追跡、一人称視点映像解析、マルチモーダル認識などの研究開発に従事し、2022年より同社研究開発グループ先端AIイノベーションセンタ知能ビジョン研究部長。2015‐2016年スタンフォード大学コンピュータサイエンス学科客員研究員。2005年FITヤングリサーチャー賞、2011年IEEE Consumer Electronics Society Best Paper Award in Television Technologyなど受賞(本データはこの書籍が刊行された当時に掲載されていたものです)