ゼロから作るDeep Learning〈6〉LLM編

個数:

ゼロから作るDeep Learning〈6〉LLM編

  • 在庫が僅少です。通常、3~7日後に出荷されます
    ※事情により出荷が遅れたり、在庫切れとなる場合もございます。
    ※他のご注文品がすべて揃ってからの発送が原則となります(ご予約品を除く)。
    ※複数冊ご注文の場合にはお取り寄せとなり1~3週間程度かかります。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【出荷予定日】
    ■通常、3~7日後に出荷されます

    【ご注意事項】 ※必ずお読みください
    ◆在庫状況は刻々と変化しており、ご注文手続き中やご注文後に在庫切れとなることがございます。
    ◆出荷予定日は確定ではなく、表示よりも出荷が遅れる場合が一部にございます。
    ◆複数冊をご注文の場合には全冊がお取り寄せとなります。お取り寄せの場合の納期や入手可否についてはこちらをご参照ください。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 384p/高さ 21cm
  • 商品コード 9784814401611
  • NDC分類 007.1
  • Cコード C3055

出版社内容情報

人気シリーズの第6弾。話題のLLM(大規模言語モデル)に挑戦する!
人気シリーズの第6弾。今回のテーマは「大規模言語モデル(LLM)」です。ChatGPTの魔法のような能力、その仕組みを自らの手で解き明かしてみませんか? 本書では、トークナイザからTransformer、事前学習から事後学習まで、LLMを支える技術をゼロから実装します。実装の舞台となるのは、CodeBot→StoryBot→WebBotという3段階のチャットボット開発。作るほどに、見えてくる--そんな読書体験が待っています。


【目次】

内容説明

人気シリーズの第6弾。今回のテーマは「大規模言語モデル(LLM)」です。ChatGPTの魔法のような能力、その仕組みを自らの手で解き明かしてみませんか?本書では、トークナイザからTransformer、事前学習から事後学習まで、LLMを支える技術をゼロから実装します。実装の舞台となるのは、CodeBot→StoryBot→WebBotという3段階のチャットボット開発。作るほどに、見えてくる―そんな読書体験が待っています。

目次

第1部 基本編―CodeBotを作る(トークナイザ 基本編;モデル 基本編;学習 基本編)
第2部 応用編―StoryBotを作る(トークナイザ 応用編;モデル 応用編;学習 応用編)
第3部 挑戦編―WebBotを作る(トークナイザ 挑戦編;モデル 挑戦編;学習 挑戦編)
付録A UTF‐8エンコーディングの仕組み
付録B Attentionのスケーリング効果の証明
付録C ベースライン付き方策勾配の不偏性の証明
付録D Adamのバイアス補正
付録E DPOの最適解の導出

著者等紹介

斎藤康毅[サイトウコウキ]
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

最近チェックした商品