全国一括!国勢調査2020の全国データの無料CSV(小地域、男女別総人口及び世帯総数)

様々な分析に使える国勢調査の最新版!(2023年時点)
ただ…ダウンロードが都道府県別で47個のzipファイルをダウンロード→解凍するのは大変…。

そこで、全47都道府県のデータをまとめてcsvにして、ダウンロードできるようにしましたのでご活用下さい。

データの出典

政府統計の総合窓口e-Stat
トップページ→統計地理情報システム→統計データダウンロード
選択条件: 国勢調査 / 2020年 / 小地域(町丁・字等) / 男女別人口総数及び世帯総数

統計地理情報システムデータダウンロード | 政府統計の総合窓口
統計GISの各種データ(統計データ、境界データ)をダウンロードすることができます。

整理に使ったツール
python3.8.12 pandas,os,glob

全国一括の国勢調査2020csvデータ

csvファイルのダウンロード
国勢調査2020小地域_tblT001081Call.csv(12.9MB)

コピペで日本の総人口を計算してみよう!

ダウンロードしたcsvをExcelで開いて、試しに日本の総人口を計算してみましょう。

単純にT001081001(人口総数)の列をsumで合計すると・・・

333,125,653人

と、日本の人口が3億人を越えてしまいました。少子化はどこへやら…。

この国勢調査のデータでは、たとえば
①「札幌市中央区」の人口の合計
と、
②「札幌市中央区」の中の「宮ヶ丘」の人口の小計
が両方並記されています。

①の中に②の人数も含まれているので、
両方を足してしまうとおかしなこと(2重にカウント)になってしまうというわけです。

総人口を出したいときには、「HYOSYO」という列が1のものだけを合計します。

※HYOSYO:地域階層レベル。
 1:市区町村、2:大字・町名(異なる字・丁目の地域を含まないもの)、3:大字・町名が同じ字・丁目の合計、4:字・丁目を表す。

具体的には、

=SUMIF(B:B,1,H:H)

という関数で求めます。ここでB列がHYOSYOの列、H列が総人口の列です。

これを実行すると・・・

126,146,099人

となりました。良い感じの数字ですね。

本当にあってるかな?
総務省統計局の資料によれば・・・


我が国の人口は1億 2614 万6千人(2020 年(令和2年)10 月1日現在)

総務省統計局「令和2年国勢調査 人口等基本集計結果」
https://www.stat.go.jp/data/kokusei/2020/kekka/pdf/outline_01.pdf

見事に一致していますね。日本の総人口って、こうやって計算されていたのですね。

コメント