出版社内容情報
本書は、プライバシーに配慮しながら機械学習に取り組むための実践的なガイドブックです。
機械学習が社会実装されていく中で、さまざまな人々のパーソナルデータの活用には大きな期待が寄せられています。一方、パーソナルデータには他人に知られたくないセンシティブな情報が含まれることもあり、プライバシーへの配慮が求められています。プライバシー保護機械学習 (PPML) は、データのプライバシー保護と、機械学習モデルの有用性、の両立を図る研究領域であり、2010年代以降、北米を中心として社会実装が進められてきました。
本書では、PPMLの基礎知識から応用まで、幅広く取り扱います。近年の中心的技術である差分プライバシーをはじめとして、圧縮プライバシーやk-匿名化などの古典的なプライバシー保護技術についても解説します。また、これらのプライバシー保護技術の機械学習への統合に関して、ロジスティック回帰などの基礎的なもの、合成データの生成方法、データプラットフォームの構築方法といった実践的なユースケースを交えて紹介します。
本書の特長は、PPMLの基本的・実践的な手法をコード例 (Python) とともに学べる点です。そのため、プライバシーをどう保護するかの実践的スキルをステップバイステップで身につけることができます。先端的な研究に興味のある方だけでなく、産業界での適用に興味のある機械学習エンジニアやソフトウェア開発者にも有益な内容となっています。
[原著]Privacy-Preserving Machine Learning, Manning Publications, 2023
【目次】
第I部 差分プライバシーによるプライバシー保護機械学習の基礎
第1章 機械学習におけるプライバシーへの配慮
1.1 AI時代におけるプライバシーの複雑化
1.2 目的外の学習がもたらす脅威
1.2.1 プライベートなデータはその場で利用する
1.2.2 データはどのようにMLアルゴリズム内部で処理されるのか
1.2.3 プライバシー保護が機械学習において重要な理由
1.2.4 規制要件と有用性:プライバシーのトレードオフ
1.3 MLシステムに対する脅威と攻撃
1.3.1 暗号化されないプライベートデータの問題
1.3.2 再構築攻撃
1.3.3 モデル反転攻撃
1.3.4 メンバーシップ推論攻撃
1.3.5 非匿名化(再識別)攻撃
1.3.6 ビッグデータ解析におけるプライバシー保護の課題
1.4 学習過程におけるプライバシーの担保:プライバシー保護機械学習
1.4.1 差分プライバシーの利用
1.4.2 局所差分プライバシー
1.4.3 プライバシー保護データ合成
1.4.4 プライバシー保護データマイニングの技術
1.4.5 圧縮プライバシー
1.5 本書の構成
第2章 機械学習における差分プライバシー
2.1 差分プライバシーとは何か
2.1.1 差分プライバシーの概念
2.1.2 差分プライバシーの働き
2.2 差分プライバシーの機構
2.2.1 バイナリメカニズム(ランダム化応答)
2.2.2 ラプラスメカニズム
2.2.3 指数メカニズム
2.3 差分プライバシーの特性
2.3.1 差分プライバシーの後処理特性
2.3.2 差分プライバシーのグループプライバシー特性
2.3.3 差分プライバシーの合成特性
第3章 機械学習における差分プライバシーの高度な概念
3.1 機械学習における差分プライバシーの適用
3.1.1 入力摂動法
3.1.2 アルゴリズム摂動法
3.1.3 出力摂動法
3.1.4 目的関数摂動法
3.2 差分プライベートな教師あり学習アルゴリズム
3.2.1 差分プライベートなナイーブベイズ分類
3.2.2 差分プライベートなロジスティック回帰
3.2.3 差分プライベートな線形回帰
3.3 差分プライベートな教師なし学習アルゴリズム
3.3.1 差分プライベートなk-meansクラスタリング
3.4 ケーススタディ:差分プライベートな主成分分析
3.4.1 水平に分割されたデータに対するPCAのプライバシー
3.4.2 水平方向に分割されたデータに対する差分プライベートなPCAの設計
3.4.3 プロトコルの性能を実験的に評価する
内容説明
差分プライバシー、匿名化、秘密計算、暗号によって、攻撃者からデータを守り、誰もが安心してデータの収集、保管、そして分析ができるようになる。
目次
第1部 差分プライバシーによるプライバシー保護機械学習の基礎(機械学習におけるプライバシーへの配慮;機械学習における差分プライバシー;機械学習における差分プライバシーの高度な概念)
第2部 局所差分プライバシーと合成データ生成(機械学習における局所差分プライバシー;機械学習の高度なLDPメカニズム;プライバシー保護された合成データ生成)
第3部 プライバシーを保証する機械学習アプリケーションの構築(プライバシー保護データマイニングの技術;プライバシー保護データ管理と操作;機械学習のための圧縮プライバシー;プライバシーを強化するプラットフォームの設計)
付録 差分プライバシーに関する詳細
著者等紹介
Chang,J.Morris[CHANG,J.MORRIS] [Chang,J.Morris]
2016年から南フロリダ大学電気工学科の教授を務めており、それ以前はアイオワ州立大学(2001‐2016)、イリノイ工科大学(1995‐2001)、ロチェスター工科大学(1993‐1995)で教員をしていました。学術界に入る前は、AT&Tベル研究所(1988‐1990)でコンピュータエンジニアとして勤務していました。最近の研究テーマは、認証からマルウェア検出、プライバシー強化技術、機械学習におけるセキュリティなど、サイバーセキュリティに関する幅広い分野に及び、国防総省(DoD)の様々な機関から資金提供を受けています。ノースカロライナ州立大学でコンピュータ工学の博士号を取得しました
Di Zhuang[DI ZHUANG] [Di Zhuang]
Snap社のセキュリティエンジニアです。中国天津の南開大学で情報セキュリティと法学の学士号を取得し、南フロリダ大学で電気工学の博士号を取得しています。精力的で熟練したセキュリティとプライバシーの研究者であり、プライバシーの設計、差分プライバシー、プライバシー保護機械学習、ソーシャルネットワーク科学、ネットワークセキュリティに関する興味、専門知識、経験を持っています。2015年から2018年までDARPAブランダイスプログラムのもとでプライバシー保護機械学習の研究を実施しました
Samaraweera,Dumindu[SAMARAWEERA,DUMINDU] [Samaraweera,Dumindu]
南フロリダ大学の助教です。オーストラリアのカーティン大学でコンピュータシステムとネットワーキングの学士号を取得しました。また、スリランカのスリランカ情報技術研究所で情報技術の学士号を、イギリスのシェフィールド・ハラム大学でエンタープライズアプリケーション開発の修士号を取得しています。南フロリダ大学(USF)で電気工学の博士号を取得し、サイバーセキュリティとデータサイエンスの研究に注力しました。博士論文“Security and Privacy Enhancment Technologies in the Deep Learning Era”では、今日のデータ駆動型アプリケーションで特定されたプライバシーとセキュリティの問題を取り上げ、そうした問題を軽減するための詳細なソリューションを提示しました。長年にわたり、米国国防総省が資金提供する複数の大規模サイバーセキュリティ研究プロジェクトに携わってきました
〓橋翼[タカハシツバサ]
2014年筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻博士後期課程修了。現在、Turing株式会社Principal Researcher。博士(工学)。専門、機械学習、データプライバシー、AIセーフティ
吉永尊洸[ヨシナガタカヒロ]
2015年東京大学大学院理学系研究科物理学専攻博士後期課程修了。現在、LINEヤフー株式会社部長/データサイエンスティスト。博士(理学)。専門、物理学、データサイエンスおよび機械学習とその応用
高濱修輔[タカハマシュウスケ]
2021年東京大学大学院情報理工学系研究科知能機械情報学専攻博士前期課程修了。現在、LINEヤフー株式会社機械学習エンジニア修士(情報理工学)。専門、機械学習(画像認識、推薦システム)
長谷川聡[ハセガワサトシ]
2014年筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻博士前期課程修了。現在、LINEヤフー株式会社リーダー/リサーチェンジニア。修士(工学)。専門、プライバシー保護技術、機械学習(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。