A2.pdfファイルから数値データを取得する方法(2)
ここでは、WordやExcelが古いバーションでpdfファイルをWordから開くことが出来ない場合について説明します。
1.最初にWordを新規作成で開いておきます。
2.つづいて、収集したpdfファイルをpdfファイルのまま開きます。
①取得したい数値データが入ったデータテーブルを探します。
②データテーブルが見つかったら、
「見だし行」は選ばずに、
「データ」部分のみ(合計部分を含んでもOK)をドラッグして選びます。
③右クリックして、
④表示されたポップアップメニューから
「コピー」をクリックします。
3.Wordに貼り付けます。
貼り付けのオプションは、
「テキストのみ保持」
を選びます。
4.Wordに張り付いたデータを、元のpdfを見ながら編集します。
【注意】
・列の区切りには「半角スペース」をつかます。
・行の区切りには「改行」を使います。
・数値データの桁区切り「,」は削除します。
5.テキスト型ファイル(書式なし)として、
「DATA」と名前を付けて保存します。
6.保存されたテキスト型ファイル「DATA.txt」を
Excelにインポートします。
①Excelを新規作成で開きます。
②「データ」タブの「データの取得と変換」で
「テキストまたはCSから」をクリックします。
③「データの取り込み」ダイアログボックスで
先に保存した「DAT.txt」を選び、
「インポート」のボタンをクリックします。
④つづいて、
データの区切り記号で「スペース」を選び、
「読み込み」ボタンで「読み込み」をクリックします。
⑤「DATA.txt」ファイルからExcelにインポートされました。
⑥「テーブルスタイルのオプション」で、
フィルターボタンや見出し行の設定を外し、
「クエリと接続」のダイアログボックスを閉じます。
インポートされたデータテーブルを
元のpdfと見比べながら修正します。
【注意】元のpdfデータとは
・列がズレていたりします。
・数値が壊れていたりします。
これで出来上がりです。
【以上】