Vision Transformer入門―新しいコンピュータビジョンの世界

個数:

Vision Transformer入門―新しいコンピュータビジョンの世界

  • ウェブストアに12冊在庫がございます。(2025年06月09日 05時45分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5判/ページ数 263p/高さ 24cm
  • 商品コード 9784297130589
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。

本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。

目次
1章 TransformerからVision Transformerへの進化
2章 Vision Transformerの基礎と実装
3章 実験と可視化によるVision Transformerの探求
4章 コンピュータビジョンへの応用
5章 Vision and Languageへの応用
6章 Vision Transformerの派生手法
7章 Transformerの謎を読み解く
8章 Vision Transformerの謎を読み解く

目次

第1章 TransformerからVision Transformerへの進化
第2章 Vision Transformerの基礎と実装
第3章 実験と可視化によるVision Transformerの探求
第4章 コンピュータビジョンへの応用
第5章 Vision and Languageへの応用
第6章 Vision Transformerの派生手法
第7章 Transformerの謎を読み解く
第8章 Vision Transformerの謎を読み解く

著者等紹介

片岡裕雄[カタオカヒロカツ]
国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員。2014年慶應義塾大学大学院理工学研究科後期博士課程修了、博士(工学)。2020年10月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。2011/2020年VIEW小田原賞、2019年度産総研論文賞、ACCV 2020 BEST PAPER HONORABLE MENTION AWARD受賞

山本晋太郎[ヤマモトシンタロウ]
2022年3月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士(工学)を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員

徳永匡臣[トクナガマサオミ]
株式会社野村総合研究所AIソリューション推進部AI tech lab.所属。2019年3月、東北大学工学部を卒業。2021年3月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語処理の業務に従事

箕浦大晃[ミノウラヒロアキ]
中部大学大学院工学研究科情報工学専攻博士後期課程3年。2020年中部大学大学院博士前期課程情報工学専攻修了。同大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事

QIUYUE[QIUYUE]
国立研究開発法人産業技術総合研究所人工知能研究センター研究員。2021年3月筑波大学大学院システム情報工学研究科博士後期課程修了(工学)、2021年10月より産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・3次元認識・動画像認識に従事

品川政太朗[シナガワセイタロウ]
奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

ぶう

15
自然言語処理系タスクで圧倒的な精度を叩き出しているトランスフォーマー。それをコンピュータービジョンタスクにも応用したのが本書のテーマであるViTである。本書にはViTの技術的な部分から、pytorchコードを用いての具体的な実装方法、そしてCNNやMLP-Mixerとの比較までViTに関するあらゆる情報が書かれている。現在のところ唯一のViT本であり、類書がないため大変有益。まだまだ未解明部分も多く、可能性は大いに期待するところではあるが、やはりCNNのシンプルさにはまだまだ大きなメリットがあると思う。2022/10/25

smatsu

5
これは凄い本だ。ViTは様々なCVタスクにTransformerを活用するっていう最近のトレンドの一つですが、その解説をこれだけちゃんとした日本語で読ませてもらえるとは。とはいえ私自身がまだまだ未熟でこの本をちゃんと読みきれる水準には達してない感じなので、精進したい。全体に歯ごたえ十分栄養満点の内容ですが、第2章の「Vision Transformerの基礎と実装」、7章の「Transformerの謎を読み解く」が今の自分には特に興味深くこの2章だけでも十分に元が取れる。この分野に興味あるなら必買です2023/10/15

PenguinTrainer

5
行列計算を齧ったことがある人にわかるようにtransformerモデルやそれを画像に適用した技術について解説してある本。2022年現在の最新のtransformerや画像認識の研究が掲載されているほか、どのような方針で派生形が開発されているかなど、数年先でも活用できる最新研究を紹介している書籍であると感じた。2023/02/25

鴨川

3
transformerの解説本として非常に優れていると思う。本書を読み、数年越しにtransformerの気持ちの部分が腹落ちした気がする。2022/10/22

Wisdom

1
この本がなかったらだいぶ置いていかれるところだった...

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/20084986
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

最近チェックした商品