データの匿名化はウソだと欧州の研究者グループが解明
https://jp.techcrunch.com/2019/07/25/2019-07-24-researchers-spotlight-the-lie-of-anonymous-data/
2019/7/25 by Natasha Lomas
TechCrunch,https://jp.techcrunch.com
【科学(学問)ニュース+、記事全文はソースをご覧ください】
ヨーロッパの2つの大学の研究者たちが、匿名化されたデータセットから、たった15のデモグラフィック属性から99.98%の精度で個人を再識別できるとされる方法を公表した。
個人情報の複雑なデータセットは、情報サンプル(サブセット)を分離するといった今の匿名化方式では再特定を防げないことを、彼らのモデルは示唆している。
つまり、匿名化して公開された大きなデータセットで、厳格なアクセス制限なくして再特定に対して安全なものはひとつもないということだ。
「私たちの研究が示しているのは、大量にサンプリングされた匿名化データセットであっても、GDPR(EU一般データ保護規則)に明記された最新の基準を満たせず、公開したらそれっきりという非特定化モデルによる匿名化の技術的、法的な妥当性を著しく阻害します」と、インペリアル・カレッジ・ロンドンとベルギーのルーヴァン・カトリック大学の研究者たちは、Nature Communicationsに掲載された論文の要約の中に書いている。
当然ながら今回の研究は、データの匿名化を元に戻せることを初めて証明したものではない。この論文に関わった研究者の一人、インペリアル・カレッジ・ロンドンのイブ=アレキサンダー・デ・モントイ(Yves-Alexandre de Montjoye)氏は、これ以前の研究でも、たとえば、クレジットカードのメタデータから、わずか4つの情報の断片をランダムに抽出するだけで、買い物をした人の90%を、一意の個人として再特定できることを証明している。
スマートフォンの位置情報のプライバシー侵害問題について調査した、デ・モントイ氏が共同筆者となった別の研究論文によれば、たった4つの時空間地点からなるデータセットから、95%の個人を一意に特定することに成功したという。
同時に、寄せ集められたデータから簡単に個人が特定できてしまうというこれらの研究結果があるにも関わらず、マーケティング目的でブローカーが売買しているような匿名化された顧客データセットには、その何倍もの個人の属性データが含まれている恐れがある。
たとえば研究者たちは、データブローカーのExperianがAlteryxにアクセス権を販売した匿名化されたデータセットには、米国の1億2000万世帯の、世帯あたり248の属性データが含まれていたことを引き合いにい出している。
彼らのモデルから見れば、基本的に、これらの世帯はみな再特定される危険性がある。それでも、大量のデータセットが、匿名化という甘い言葉に載せられて、今でも取り引きされている。
個人情報がどれだけ商用目的で取り引きされているかに関して、さらに怖い話を聞きたい方に教えよう。あの悪評高い、すでに廃業した、政界にデータを売る会社Cambridge Analyticaは、昨年、こう話していた。それは、Facebookのデータ不正利用スキャンダルの最中のことだ。米国人有権者をターゲットにした内密な活動の基礎となったデータセットは、Acxiom、Experian、Infogroupといった有名データブローカーからライセンスされたものだった。とくに同社が強調していたのは、「米国人個人の無数のデータ点」は「超大手の信頼あるデータ収集業者とデータ販売業者」から合法的に入手したということだ。
匿名データセットから、驚くほど簡単に個人を再特定できてしまうことを、研究者たちは何年間にもわたり示してきたが、今回の研究の最大の成果は、あらゆるデータセットからどれだけ簡単に個人を特定できるかを見積もれる統計モデルを構築したことにある。
彼らは、データのマッチングが正しい可能性を演算することで、これを実現している。そのため、基本的に、マッチの一意性が評価される。また彼らは、小さなサンプリングの断片がデータの再特定を許してしまうことも突き止めた。
「人口統計と調査データからの210件のデータセットを使って私たちのアプローチを検証したところ、非常に小さなサンプリングデータの断片であっても、再特定の防止や個人データの保護の妨げになることがわかりました」と彼らは書いている。・・・
■■略
[原文へ]https://techcrunch.com/2019/07/24/researchers-spotlight-the-lie-of-anonymous-data/
(翻訳:金井哲夫)
【情報/AI/管理】データの匿名化はウソだと欧州の研究者グループが解明[08/09]
■ このスレッドは過去ログ倉庫に格納されています
2019/08/09(金) 15:09:52.44ID:CAP_USER
2ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:12:38.98ID:yB/Bn3dZ 1)データーはデーターと関連付けられるからデーターたり得る
2)データーの精度が高ければ、データーの出典元を形づけられる
3)データーはデーター相互に連携できるからデーターとして役立つ
とう理屈だけで、個人が特定できる事が立証される
2)データーの精度が高ければ、データーの出典元を形づけられる
3)データーはデーター相互に連携できるからデーターとして役立つ
とう理屈だけで、個人が特定できる事が立証される
3ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:13:38.00ID:GTCCx+Rm まあ隠れるのは無意味だな
4ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:23:59.28ID:PY0MLtow アキネイターと同じだろ
項目が少なくても個人の特定は可能
項目が少なくても個人の特定は可能
5ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:26:26.31ID:9lBNCkkQ 毎日同じ電車に乗ってるおっさんを知ってるけど、興味がないデータだからって特定できても、仕方がないんだな
2019/08/09(金) 15:29:39.13ID:fZuX8k1x
データの匿名性は破れてるのいやまだだのと何年もやってたけど結局特定可能って事?
7ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:40:58.25ID:DKBqTmUd 数百万の架空の有名人まで含むデータの中から
十数個の質問で一個を特定してしまう
アキネの存在がすべてを物語っている
十数個の質問で一個を特定してしまう
アキネの存在がすべてを物語っている
8ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:43:35.44ID:stNZXSoC9ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:44:34.97ID:A1HhTcOd キャッシュもIPも抜きまくりだろ
Andromedaなんか端末再起動してもファイルで保存してるし
Andromedaなんか端末再起動してもファイルで保存してるし
10ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:45:51.26ID:F1piAPQH 2万2000のポルノサイトを分析したら74%がグーグルにデータを送信していた
https://asahi.5ch.net/test/read.cgi/newsplus/1563632087/
https://asahi.5ch.net/test/read.cgi/newsplus/1563632087/
11ニュースソース検討中@自治議論スレ
2019/08/09(金) 15:47:53.91ID:A1HhTcOd それより
ネットでなんか買うと
ずっと「オマエこれ買っただろ」って出てくる広告
なんとかならんかな
ズラッとTENGA広告が並んだときは
顔から火が出たわ
ネットでなんか買うと
ずっと「オマエこれ買っただろ」って出てくる広告
なんとかならんかな
ズラッとTENGA広告が並んだときは
顔から火が出たわ
12ニュースソース検討中@自治議論スレ
2019/08/09(金) 16:04:10.60ID:IzqIsaeo AI「知ってた
2019/08/09(金) 16:33:52.28ID:21yq5F6G
プライバシーなんてあってないようなもんなんだよねえww
いくつかのデータがあればネット上はある個人を再現できるんだから、死んでも
死なないってことにもなるんだろうけどww
いくつかのデータがあればネット上はある個人を再現できるんだから、死んでも
死なないってことにもなるんだろうけどww
2019/08/09(金) 19:04:40.31ID:wfVWtsvP
15ニュースソース検討中@自治議論スレ
2019/08/09(金) 19:31:25.42ID:SHLGYGxY "お前は見られている"
とか常に思ってるほうがモラルは高くなるかもしれんがな
ネットでも変な言動を取りづらくはなるかも
監視者が邪悪な恐怖政治組織とかじゃなけりゃあなあ
"グーグルさまが見てる"
とか常に思ってるほうがモラルは高くなるかもしれんがな
ネットでも変な言動を取りづらくはなるかも
監視者が邪悪な恐怖政治組織とかじゃなけりゃあなあ
"グーグルさまが見てる"
16ニュースソース検討中@自治議論スレ
2019/08/09(金) 19:44:33.20ID:jbPmLjwv 5ちゃんに書き込んでることバレるの?
2019/08/09(金) 19:47:06.87ID:jIvG1D7c
2019/08/09(金) 19:58:08.16ID:wety9qZq
できるだけデマをバラ撒くしかないな
ビッグデータをゴミにするほどの量で
ビッグデータをゴミにするほどの量で
19ニュースソース検討中@自治議論スレ
2019/08/09(金) 20:36:12.26ID:apc/YRVC 一番いいのはネットにアクセスしないこと
次はデータが入っているものを物理的に壊すことかな
次はデータが入っているものを物理的に壊すことかな
20ニュースソース検討中@自治議論スレ
2019/08/09(金) 20:38:20.80ID:t6IRjukg l-多様性を満たしても?
21ニュースソース検討中@自治議論スレ
2019/08/09(金) 20:42:52.39ID:28VQHuCZ22ニュースソース検討中@自治議論スレ
2019/08/09(金) 20:48:05.27ID:t6IRjukg 生徒の成績のデータをUSBメモリに入れて持ち歩くのは危険?
生徒の名前をidに変えて匿名化してもあかんの?
生徒の名前をidに変えて匿名化してもあかんの?
23ニュースソース検討中@自治議論スレ
2019/08/09(金) 21:24:09.70ID:p1C74hsp >>1
ネットの遊びの魔神が適当に有名人を出してくれるヤツ
ネットの遊びの魔神が適当に有名人を出してくれるヤツ
24ニュースソース検討中@自治議論スレ
2019/08/09(金) 23:25:28.79ID:ifBcMvMO おれが実況スレでおっぱいおっぱい言ってるのが特定されるのか
25ニュースソース検討中@自治議論スレ
2019/08/10(土) 06:07:36.18ID:qh0twIFS GAFA「余計なことを言うな。由らしむべし知らしむべからず。」
26ニュースソース検討中@自治議論スレ
2019/08/16(金) 15:32:27.90ID:Y+6yLneu よくある映画とかで、銀行に忍び込むために同じビルに入っている小さな会社の社員の個人情報を掴んで
なりすましたりするとか、清掃会社社員の個人情報をつかってビルに侵入するとか、あるよね。
DDoSアタックも初期は個人のパソコンをハッキングしまくって攻撃してたし、個人情報って思ったよりも使い勝手があるよ。
冤罪攻撃もあるし。
なりすましたりするとか、清掃会社社員の個人情報をつかってビルに侵入するとか、あるよね。
DDoSアタックも初期は個人のパソコンをハッキングしまくって攻撃してたし、個人情報って思ったよりも使い勝手があるよ。
冤罪攻撃もあるし。
27ニュースソース検討中@自治議論スレ
2019/08/18(日) 11:30:24.46ID:eKYZqQ7e 献血した奴で皇胤はすべてマークされているだろうなwww
28よっちゃん
2019/08/28(水) 19:30:06.69ID:z6msK0/V 再生核研究所声明 470 (2019.2.2)
ゼロ除算 1/0=0/0=z/0=\tan(\pi/2)=0 発見5周年を迎えて
http://vixra.org/pdf/1908.0100v1.pdf
Unique-IP document downloads: 506 times
Fundamental of Mathematics; Division by Zero Calculus and a New Axiom
ゼロ除算 1/0=0/0=z/0=\tan(\pi/2)=0 発見5周年を迎えて
http://vixra.org/pdf/1908.0100v1.pdf
Unique-IP document downloads: 506 times
Fundamental of Mathematics; Division by Zero Calculus and a New Axiom
29ニュースソース検討中@自治議論スレ
2019/09/01(日) 11:23:27.99ID:WEpIPBlf 完全の安全が不可能なように完全な匿名化も不可能性しょう。
31ニュースソース検討中@自治議論スレ
2019/09/01(日) 11:58:16.09ID:QE7ONcsP2019/09/01(日) 12:33:10.26ID:b/7DB+mI
>>1
スノーデンは今日(米国時間2014/10/12)、New Yorker Festivalの中でリモートインタビューを受け、
プライバシーを守るために、何がわれわれにできるかについていくつか質問に答えた。
最初の回答は、政府方針の改革についてだった。
自分には「隠すものは何もない」という立場を取る人々に対して、
それは「権利のしくみに関する責任の在り方を覆すことだ」と反論した。
「私には隠す物など何もない」と言うことは「この権利のことなど私にはどうでもよい」と言っているのと同じだ。
つまりは「私はこの権利を持っていない、なぜならそれを正当化しなくてはならなくなったからだ」とあなたは言っている。
本来、政府によるあなたの権利に対する侵害は、政府が正当化しなくてはならない。
*****
665 名前:名無しさん@1周年 Mail: 投稿日:2019/01/05(土) 16:56:28.80 ID:PO/FMEdW0
結局自分が正しくないとわかってる奴は論点をずらしてわめき散らすしかない
スノーデンは今日(米国時間2014/10/12)、New Yorker Festivalの中でリモートインタビューを受け、
プライバシーを守るために、何がわれわれにできるかについていくつか質問に答えた。
最初の回答は、政府方針の改革についてだった。
自分には「隠すものは何もない」という立場を取る人々に対して、
それは「権利のしくみに関する責任の在り方を覆すことだ」と反論した。
「私には隠す物など何もない」と言うことは「この権利のことなど私にはどうでもよい」と言っているのと同じだ。
つまりは「私はこの権利を持っていない、なぜならそれを正当化しなくてはならなくなったからだ」とあなたは言っている。
本来、政府によるあなたの権利に対する侵害は、政府が正当化しなくてはならない。
*****
665 名前:名無しさん@1周年 Mail: 投稿日:2019/01/05(土) 16:56:28.80 ID:PO/FMEdW0
結局自分が正しくないとわかってる奴は論点をずらしてわめき散らすしかない
33ニュースソース検討中@自治議論スレ
2019/11/06(水) 10:43:59.37ID:Vdw6hd5m >>27
ワジンのワをもって尊しと成す
ワジンのワをもって尊しと成す
34ニュースソース検討中@自治議論スレ
2019/11/06(水) 10:46:50.22ID:Vdw6hd5m35ニュースソース検討中@自治議論スレ
2019/11/06(水) 11:05:56.27ID:cnMDaQZU 政府の統計目的ならともかく、民間企業が使う場合は個人の氏名と紐づけされて
ないとあまり意味がないからね。
表向きは匿名化したデータということになってても、まず個人情報と紐づけているとみて
間違いはないと思う。
ないとあまり意味がないからね。
表向きは匿名化したデータということになってても、まず個人情報と紐づけているとみて
間違いはないと思う。
36ニュースソース検討中@自治議論スレ
2019/11/06(水) 12:28:00.72ID:Vdw6hd5m この手のスレは収納こに保管されて書き込み出来ないのが通例なんじゃね?
書き込みテストして見たんだけどw
書き込みテストして見たんだけどw
2019/11/06(水) 13:16:18.64ID:IE8rVH7H
何年か前にキャッシュレス決済のいくつかの情報だけで個人を突き止めるとこが可能って記事を読んだ
2019/11/06(水) 20:09:57.56ID:btDE19bY
スマホにあらゆる情報を入れてるやつが信じられない
銀行やクレジットも一本化してこれ一台で何でもできるウェーイ
銀行やクレジットも一本化してこれ一台で何でもできるウェーイ
2019/11/06(水) 20:49:28.45ID:aQu14m06
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 「答える気ないとしか…」 動画問題、高市首相に党内からも懸念 [蚤の市★]
- 【ひろゆき】「法に触れないの?」 阿部前監督の“暴行報道”に一石、守秘義務問題でネット大論争 [Ailuropoda melanoleuca★]
- ナフサ由来品の供給、経産省「平年並み」 塗料・シンナー15%増 [少考さん★]
- 【セブンイレブン】揚げ物半額セール、“想定を上回る売れ行き”に謝罪 SNS「現場の人がかわいそう」「店員に感謝しかない」 [樽悶★]
- 藤井フミヤが語る音楽界の変化 「社会が望んでない」ジャンルの曲とは…「口説くような歌がないよね 頑張ろう、みたいな歌ばっか」 [muffin★]
- ミッツ 「嵐か父の通夜か」SNS上の論争に私見「誤解を恐れずに言えば、ライブ優先」「お通夜の日取りくらい、ちょっとずらせる」 [muffin★]
- 低身長の君らが俺に喧嘩売る理由
- 椎名真昼ってそんな可愛いか?
- 来週200万円がかかったカードゲームの大会あるんだが
- 株やってる人、大丈夫そ?☺
- シュレックのアナル
- 人気配信者「『けいおん!』に影響されて軽音サークルに入ってくる奴は流行り物に流されるゴミ!」 [634830743]