Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒ入門 / 片岡裕雄【監修】/山本晋太郎/徳永匡臣/箕浦大晃/ＱＩＵＹＵＥ/品川政太朗【著】

個数：

Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒ入門―新しいコンピュータビジョンの世界

片岡裕雄【監修】/山本晋太郎/徳永匡臣/箕浦大晃/ＱＩＵＹＵＥ/品川政太朗【著】
価格 ¥3,520（本体¥3,200）
技術評論社（2022/09発売）
ポイント 32pt

ウェブストアに5冊在庫がございます。（2026年07月15日 21時00分現在）
通常、ご注文翌日～2日後に出荷されます。
出荷予定日とご注意事項
※上記を必ずご確認ください

【ご注意事項】 ※必ずお読みください
◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
◆事情により出荷が遅れる場合がございます。
◆お届け日のご指定は承っておりません。
◆「帯」はお付けできない場合がございます。
◆画像の表紙や帯等は実物とは異なる場合があります。
◆特に表記のない限り特典はありません。
◆別冊解答などの付属品はお付けできない場合がございます。
●3Dセキュア導入とクレジットカードによるお支払いについて
●店舗受取サービス（送料無料）もご利用いただけます。
ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら

サイズ B5判／ページ数 263p／高さ 24cm
商品コード 9784297130589
NDC分類 007.1
Cコード C3055

出版社内容情報

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer（ViT）です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。

本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。

目次
1章 TransformerからVision Transformerへの進化
2章 Vision Transformerの基礎と実装
3章実験と可視化によるVision Transformerの探求
4章コンピュータビジョンへの応用
5章 Vision and Languageへの応用
6章 Vision Transformerの派生手法
7章 Transformerの謎を読み解く
8章 Vision Transformerの謎を読み解く

第１章　ＴｒａｎｓｆｏｒｍｅｒからＶｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒへの進化
第２章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの基礎と実装
第３章　実験と可視化によるＶｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの探求
第４章　コンピュータビジョンへの応用
第５章　Ｖｉｓｉｏｎ　ａｎｄ　Ｌａｎｇｕａｇｅへの応用
第６章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの派生手法
第７章　Ｔｒａｎｓｆｏｒｍｅｒの謎を読み解く
第８章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの謎を読み解く

著者等紹介

片岡裕雄［カタオカヒロカツ］
国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員。２０１４年慶應義塾大学大学院理工学研究科後期博士課程修了、博士（工学）。２０２０年１０月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。２０１１／２０２０年ＶＩＥＷ小田原賞、２０１９年度産総研論文賞、ＡＣＣＶ　２０２０　ＢＥＳＴ　ＰＡＰＥＲ　ＨＯＮＯＲＡＢＬＥ　ＭＥＮＴＩＯＮ　ＡＷＡＲＤ受賞

山本晋太郎［ヤマモトシンタロウ］
２０２２年３月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士（工学）を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員

徳永匡臣［トクナガマサオミ］
株式会社野村総合研究所ＡＩソリューション推進部ＡＩ　ｔｅｃｈ　ｌａｂ．所属。２０１９年３月、東北大学工学部を卒業。２０２１年３月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語処理の業務に従事

箕浦大晃［ミノウラヒロアキ］
中部大学大学院工学研究科情報工学専攻博士後期課程３年。２０２０年中部大学大学院博士前期課程情報工学専攻修了。同大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事

ＱＩＵＹＵＥ［ＱＩＵＹＵＥ］
国立研究開発法人産業技術総合研究所人工知能研究センター研究員。２０２１年３月筑波大学大学院システム情報工学研究科博士後期課程修了（工学）、２０２１年１０月より産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・３次元認識・動画像認識に従事

品川政太朗［シナガワセイタロウ］
奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教（本データはこの書籍が刊行された当時に掲載されていたものです）
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ドワンゴの提供する「読書メーター」によるものです。

ぶう

自然言語処理系タスクで圧倒的な精度を叩き出しているトランスフォーマー。それをコンピュータービジョンタスクにも応用したのが本書のテーマであるViTである。本書にはViTの技術的な部分から、pytorchコードを用いての具体的な実装方法、そしてCNNやMLP-Mixerとの比較までViTに関するあらゆる情報が書かれている。現在のところ唯一のViT本であり、類書がないため大変有益。まだまだ未解明部分も多く、可能性は大いに期待するところではあるが、やはりCNNのシンプルさにはまだまだ大きなメリットがあると思う。2022/10/25

smatsu

これは凄い本だ。ViTは様々なCVタスクにTransformerを活用するっていう最近のトレンドの一つですが、その解説をこれだけちゃんとした日本語で読ませてもらえるとは。とはいえ私自身がまだまだ未熟でこの本をちゃんと読みきれる水準には達してない感じなので、精進したい。全体に歯ごたえ十分栄養満点の内容ですが、第2章の「Vision Transformerの基礎と実装」、7章の「Transformerの謎を読み解く」が今の自分には特に興味深くこの2章だけでも十分に元が取れる。この分野に興味あるなら必買です2023/10/15

PenguinTrainer

行列計算を齧ったことがある人にわかるようにtransformerモデルやそれを画像に適用した技術について解説してある本。2022年現在の最新のtransformerや画像認識の研究が掲載されているほか、どのような方針で派生形が開発されているかなど、数年先でも活用できる最新研究を紹介している書籍であると感じた。2023/02/25

鴨川

transformerの解説本として非常に優れていると思う。本書を読み、数年越しにtransformerの気持ちの部分が腹落ちした気がする。2022/10/22

Wisdom

この本がなかったらだいぶ置いていかれるところだった．．．

レビューを書く、レビューをもっと見る

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/20084986

ご注意事項

ご注意
リンク先のウェブサイトは、株式会社ドワンゴの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
最新のアドレスについては、お客様ご自身でご確認ください。
リンク先のウェブサイトについては、「株式会社ドワンゴ」にご確認ください。

閉じる