都道府県の農業経営指標に関するファイル群から,経営類型および経営指標に関する情報を抽出・解析し,統一フォーマットへと変換・構造化を行うタスクです。
■ 入力データ
以下の2種類のファイルを入力とします。
農業技術文書: 各自治体が公開するPDF、Excel形式の文書
タスク指示書: 都道府県ごとに定めた抽出対象となるデータ、構造化処理で期待する出力の形式や値に関して説明したドキュメント
■ 出力データ
統一フォーマット化した経営類型・経営指標をJSONフォーマットで出力します。
経営類型: 栽培する作物と規模を定め、生じる収支などをまとめた情報です。入力データから必要な情報を抽出し、以下の4つの統一フォーマットに構造化します。
前提表: 栽培する作物一覧と、目標所得、労働力などのシミュレーションの前提条件
栽培規模: 栽培する作物一覧と面積
経営収支: 設定した目標所得を達成する根拠となる収入・支出
資本装備と減価償却費: 栽培に必要となる機材・資材とそれらの償却費用
経営指標: 作物ごとに必要となる労働力や土地,機械設備,資材などの資本,栽培のスケジュールに関する情報です。入力データから必要な情報を抽出し、以下の3つの統一フォーマットに構造化します。
経営収支: 単位耕地面積あたりにおける収入・支出
作業技術: 使用する技術、機材、資材
作業時間: 各作業の年間スケジュール、作業に要する時間
■ 評価指標
統一フォーマットの経営類型・経営指標の項目に対する適合率・再現率・F1スコア
TBA