出版社内容情報
本書は、自然言語処理について初歩から学べる書籍です。プログラミングについては、なんらかのプログラミング言語を使ったことのある開発者を対象に書いています。
自然言語とは、私たち人間が日常的に読み書きしたり、話したりするのに使っている言語のことです。そして、自然言語で書かれたテキストデータをコンピュータで処理するための技術を自然言語処理と呼びます。自然言語処理によって実行できるタスクの代表的な例としては、自動翻訳や質問応答、対話などがあります。
本書では、この自然言語処理について、今まで学習したことがない人でも学べるように、基礎から解説しています。自然言語をコンピュータで処理するために、事前にどのような処理をしておくのか、どのように単語や文章を解析するのか、自動翻訳などのタスクを実行させるためにどのような処理を行うのか、などについて、やさしく説明していきます。
基礎からはじめて、単語分散表現やテキスト分類、系列ラベリング、系列変換、アテンションといった、自然言語処理では欠かせない技術について、理論を解説した上で、Pythonを使って実装し、手を動かしながら理解できるようにしています。
また、現在の自然言語処理は、機械学習や深層学習とも切り離せません。ですので本書では、これらの技術についても基礎から説明し、Pythonを使って処理を実装していきます。基礎的な実装のみではなく、RNN、LSTM、CNNさまざまなモデルを使っての実装、特徴量エンジニアリングや正則化、ハイパーパラメータチューニングなど、実際の処理で必要になるところまで、詳しく解説しています。
本書の特徴として、ほとんどの実装で日本語のデータを使っている点があります。機械学習を用いた自然言語処理手法を日本語に対して適用しようとすると、途端にデータセットの壁に当たります。このような状況を踏まえ、本書では、日本語のデータセットで自然言語処理の様々なタスクを試せるようにしています。
これから、プログラムでの実装も合わせて自然言語処理をしっかり学習したいという方にとっては、最適の1冊です。
内容説明
自然言語処理を基礎から学ぼう!「日本語」のデータを使って手を動かしながら、「今の自然言語処理」を身に付ける!
目次
1 機械学習を使った自然言語処理(自然言語処理の基礎;機械学習;コーパス;テキストの前処理;特徴エンジニアリング;機械学習アルゴリズム)
2 深層学習を使った自然言語処理(ニューラルネットワーク;単語分散表現;テキスト分類;系列ラベリング;系列変換;機械学習とクラウド)
著者等紹介
中山光樹[ナカヤマヒロキ]
1991年生まれ。電気通信大学卒、電気通信大学情報理工学研究科修士課程修了。現在、企業にて、自然言語処理や機械学習の研究開発に従事。また、GitHub上でオープンソースソフトウェアの自然言語処理ライブラリ開発にも貢献している(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ぶう
めかぶこんぶ
shin
さな
茶屋博紀
-
- 和書
- 朝鮮王朝韓国服飾図録