行政区域や鉄道などのシェープファイルは属性データをもっています。今回は、新たに属性データを作成したりするために、シェープファイルの属性データを利用する方法について説明します。(QGIS 2.14.9を使用)
・・・と、いかにも一般化した書き方をしていますが、ぶっちゃけた話、今回のはハンダイ・ジンチリのGIS実習向けに特化した内容です。以下、国土数値情報から入手した1920(大正9)年の行政区域の地図データに、1920年実施の第1回国勢調査データを結合するという作業を例にして、説明を進めます。
なお、今回使用する1920年の行政区域データは、おおむね現在の豊中市・池田市・箕面市・尼崎市・伊丹市・宝塚市・川西市に対応する範囲に限定しています。【阪大受講者向け】<GISwork2016>→<各グループの作業用フォルダ>→<maps>→<ksj>フォルダ内に、このシェープファイルがあります(ファイル名:「studyarea-19200101_dissolved」)。
(1) シェープファイルの属性データを別ファイルで保存
シェープファイルのレイヤ上で右クリック→<名前をつけて保存する>を選択。
<形式>のプルダウンから、<カンマで区切られた値[CSV]>を選択。
<パス>のところにある<ブラウズ>をクリックし、ファイルを保存するフォルダを指定した上で、適当なファイル名を入力し(ここでは「studyarea1920」とする)、<保存>をクリック。
<OK>をクリック。指定したフォルダ内を見ると、新たにCSVファイル(studyarea1920.csv)が保存されているはずである。Excelで開くと下図のような感じ。
(2) 1920年国勢調査のデータを作成
1920年実施の第1回国勢調査の結果はe-Statから入手することができますが、残念なことに、CSV形式やExcel形式ではなく、PDFファイルでの提供となっています。
原本をスキャンしたと思われるPDFに掲載されているデータを利用する方法として、OCRにかけるという手も考えられますが、今回は対象地域の数が少ないので、PDFを見ながらデータを手入力してしまいます。
studyarea1920.csvを開く。
<NAME>の列に入力されている郡・市町村名データを利用し、今回は各市町村の世帯数および人口(人員)をPDFを参照しながら入力。
不要な列を削除し、国勢調査の掲載順に市町村を並べ替えると、上図のようなデータができた。
(3) 地図データに1920年国勢調査データを結合
地図データと統計データの結合方法については、[NA-GIS96]で説明しているので、ここでは詳しい手順は省略。今回、結合キーとしては<NAME>フィールド(郡・市町村名)を用いた。
ついでなので、人口分布の階級区分図を作成。階級区分図の作成方法については、[NA-GIS37]や参考文献などを参照。
プロジェクトを上書き保存して、今回の作業はこれにて終了。