出版社内容情報
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。
本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。
目次
1章 TransformerからVision Transformerへの進化
2章 Vision Transformerの基礎と実装
3章 実験と可視化によるVision Transformerの探求
4章 コンピュータビジョンへの応用
5章 Vision and Languageへの応用
6章 Vision Transformerの派生手法
7章 Transformerの謎を読み解く
8章 Vision Transformerの謎を読み解く
目次
第1章 TransformerからVision Transformerへの進化
第2章 Vision Transformerの基礎と実装
第3章 実験と可視化によるVision Transformerの探求
第4章 コンピュータビジョンへの応用
第5章 Vision and Languageへの応用
第6章 Vision Transformerの派生手法
第7章 Transformerの謎を読み解く
第8章 Vision Transformerの謎を読み解く
著者等紹介
片岡裕雄[カタオカヒロカツ]
国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員。2014年慶應義塾大学大学院理工学研究科後期博士課程修了、博士(工学)。2020年10月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。2011/2020年VIEW小田原賞、2019年度産総研論文賞、ACCV 2020 BEST PAPER HONORABLE MENTION AWARD受賞
山本晋太郎[ヤマモトシンタロウ]
2022年3月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士(工学)を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員
徳永匡臣[トクナガマサオミ]
株式会社野村総合研究所AIソリューション推進部AI tech lab.所属。2019年3月、東北大学工学部を卒業。2021年3月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語処理の業務に従事
箕浦大晃[ミノウラヒロアキ]
中部大学大学院工学研究科情報工学専攻博士後期課程3年。2020年中部大学大学院博士前期課程情報工学専攻修了。同大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事
QIUYUE[QIUYUE]
国立研究開発法人産業技術総合研究所人工知能研究センター研究員。2021年3月筑波大学大学院システム情報工学研究科博士後期課程修了(工学)、2021年10月より産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・3次元認識・動画像認識に従事
品川政太朗[シナガワセイタロウ]
奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ぶう
smatsu
PenguinTrainer
鴨川
Wisdom
-
- 和書
- ZESTAR総合英語