Rise of Administrative Data in Economics

経済学の問題点を指摘したシリーズ(典型的な、あまり深みのない経済学批判なので取り上げもしなかった)に代表されるように、最近は質が落ちてきているという話が聞かれるEconomist誌が、経済学関連のめずらしくタイムリーな記事を載せていたので言及しておく。

経済学におけるサーベイデータ(Survey Data)から行政的データ(Administrative Data)へのシフトについてである。記事は二つになっており、これこれである。これまでは、経済学者は、主に、政府(あるいは民間が主体のこともある)が定期的に実施するインタビューに基づいてつくられたデータ(サーベイデータ)を主に使ってきた。但し、最近は、サーベイデータの質の低下が認識されてきている。その背景にある大きな要因は、返答率の低下である。
上のグラフはEconomist誌から引用させてさせてもらったものだが、アメリカ、カナダ、UKの代表的なサーベイデータの返答率(インタビューしたら答えてくれた人の割合)の変化を示している。どのサーベイデータの返答率も低下傾向にある。たとえば、アメリカの家計の消費動向を1980年代から追っている貴重なデータであるConsumer Expenditure Surveyの場合、返答率は2001年の80%をちょっと下回るレベルから2016年は63%くらいまで低下している。これがなぜ問題かというと、答えてくれる人が少なかったり、答えてくれる項目の数が減った場合、その減少を補うために、専門家が、入手できなかったデータを推定しているのであるが、推定しなければならないデータの数が増えれば増えるほど、まぁ、そのデータセット自体が当てにならない度合いが高まるのは想像がつくであろう。実際に、記事では、サーベイデータと他のデータとの整合性が以前より低下してきていると指摘している。さらに問題なのは、返答をしてくれない人の特徴が、返答をしてくれる人の特徴と異なる場合、返答してくれた人のデータに基づいて返答してくれなかった人のデータを推定しようとすると、間違ってしまうということである。

このような問題を受けて、経済学では、行政データ(政府が何らかの目的のために集めたデータ)を使う頻度が高まってきている。
上のグラフは、NBER(全米経済研究所、アメリカの有名な経済学者が多く所属してワーキングペーパーを出している、もっとも有力な経済のシンクタンク)のワーキングペーパーの要旨において、「行政データ」という言葉が使われた頻度を追ったものである。2000年ごろまではほぼゼロだったが、2017年には30近いワーキングペーパーで使われるようになっている(例えば、2017年のワーキングペーパーの数は1163なのでワーキングペーパー全体に占める割合はまだ小さい(2.4%)が、とても速いスピードで増加しているのは見て取れる)。

行政データは、サーベイデータのように、返答率の低下や返答の質の低下で悩まされることはないが、別の問題点がいろいろある。1つ目は、行政データはある目的のために集められたものなので、経済学者が、例えば全国民からランダムにサンプリングされたデータが欲しいと思っても、必ずしもそういうものが手に入るわけではないということである。例えば、代表的な行政データは税の申告のデータである。これを使うと、税を申告した人の所得が正確に把握できる。しかし、国民全員が税を申告する必要がなければ、経済学者が欲しいデータとは異なることになる。それに、税を申告する際には、年齢や性別や家族構成という情報を提供しないので、そういう情報も組み合わせたい場合には簡単には対応できないということになる。ただし、アメリカの場合、社会保障番号(マイナンバーってよく知らないがそのようなものだと思う)を使って、税のデータと別のデータと組み合わせることで、税を申告した人の所得、家族構成などが把握できるという方法が開発されている。

2つ目は、このデータは使うためには、そのデータを使わせてくれる人を知っていなければならなかったり、バックグラウンドチェックなどいろいろな手続きを経なければならないので、既に地位が確立されていて、リソースやコネがある人が有利になるということがある。ちょっと前のエントリで触れたが、Raj Chettyはすごい行政データを使った研究を進めているが、これは、彼だから使えるという側面が多分にある。いい悪いは別として、経済学者間で富むものがさらに富むようになるという現象を生み出している。

3つ目は、上の点に関連するが、行政データを使ってある論文を書いて、例えば、その論文をジャーナルに送ったとして、エディターあるいはレフェリーには、結果を検証する方法がない。論文が出た後で、誰かが追試しようとしても、元になった行政データにアクセスできない限りどうしようもないのである。行政データを使っている人がいい加減なことをしているといいたいわけではないが、あるデータのクリーニング方法、その他手続き、あるいはモデルの仮定をちょっと変えたら結果が大きく変わるなんてことはよくある話なので、あとで追試できないというのはとても大きな問題点である。

もちろん、学会というのは、今後の経済学の方向性を変える可能性のある、起業家精神に富んだ行動に対して大きなインセンティブを付けるものなので、これまで使えなかったデータを使えるようにした人に報酬(パブリケーション)で報いるべきなのは当然なんだけれども、経済学会が上で挙げたようなイシューにどのように対応していくかは、興味深い。

0 comments:

Post a Comment