Synthetic Population

Synthesize household data from publicly released statistics with caring privacies.

What is the Synthetic Population?

Synthetic Population is a virtual individual household data synthesized from publicly released statistics. We synthesize the data using Prefecture-Level, City-Level and Small-Area-Level statistics. Each synthesized household is randomly projected in the area of the small area. Therefore, a different household is projected in a different data set. 

The following figure shows that each household is synthesized with the attributes such as age, sex, role in a family, type of occupation, industry of occupation, size of workplace, and income of the worker. With those household attributes, the location attributes such as prefecture, city, small area, and coordinate are given to each household. When these data is provided, the location attributes is considered according to the security level in the table. 

Synthetic Population Method

Each household composition is synthesized by minimizing the difference between the statistics collected from synthesized household and the statistics publicly released from the government. To minimize the difference, we exchange household members between selected households using the simulated annealing method. 

When utilize the synthetic population data from our laboratory, please refer the following article. 

Tadahiko Murata, Takuya Harada, Daiki Masui, Comparing Transition Procedures in Modified Simulated-Annealing-Based Synthetic Reconstruction Method without Samples, SICE Journal of Control, Measurement, and System Integration, Vol.10, No.6, pp. 513-519, 2017

When synthesizing the population data, we are supported by JHPCNHPCI.

Oska University and Hokkaido University that provide us the computing resource kindly published the following video and article in the website.
 Cybermedia Center, Osaka University HPSC News Video (July, 2019)
 Information Infrastructure Center, Hokkaido Universit iiC HPC Brochure (March, 2020)

The following papers are published relating to synthetic populations. Japanese articles are shown in their own Japanese titles.

Household Synthesis with Household Composition, Age and Sex

[H19] 講演会優秀発表賞原田拓弥,村田忠彦,「出生コーホートによる出生数を考慮した人口個票の合成」,計測自動制御学会システム・情報部門学術講演会(千葉大学、11月23-25日、2019), pp.554-559, 2019.
[H18] 原田拓弥,村田忠彦,「出生コーホートを考慮した日本全国の仮想個票の合成」,計測自動制御学会第18回社会システム部会研究会資料(沖縄,3月17-19日,2019), 6 pages,2019.
[H17] 原田拓弥,村田忠彦,「世帯合成法における世帯構成員の年齢と役割を考慮した初期世帯と近傍解生成法の改良」,計測自動制御学会 システム・情報部門 学術講演会資料(富山国際会議場, 11月25-27日, 2018), GS06-02 (6ページ), 2018.
[H16] Tadahiko Murata, Takuya Harada, “Synthetic Method for Population of A Prefecture Using Statistics of Local Governments, Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2018 (Miyazaki, Japan, Oct. 7-10, 2018), pp. 1171-1176, 2018.
[H15] 原田拓弥,村田忠彦,「市区町村の統計表を考慮した都道府県単位の仮想個票の合成」,計測自動制御学会第15回社会システム部会研究会資料(沖縄,3月14-16日,2018), pp. 30-35, 2018.
[H14] 原田拓弥,村田忠彦,枡井大貴,「家族類型と世帯内の役割を考慮したSA法による大規模世帯の復元」,計測自動制御学会論文誌,Vol. 54, No. 9, pp. 705-717,2018.
[H13] Tadahiko Murata, Takuya Harada, Daiki Masui, “Comparing transition procedures in modified simulated-annealing-based synthetic reconstruction method without samples”, SICE Journal of Control, Measurement, and System Integration, vol. 10, no. 6, pp. 513-519, 2017.
[H12] Tadahiko Murata, Takuya Harada, “Nation-Wide Synthetic Reconstruction Method,” Proc. of 2017 IEEE Symposium Series on Computational Intelligence (Hawaii, USA, Nov.27–Dec. 1, 2017), pp.596-601, 2017.
[H11] 枡井大貴,村田忠彦,「統計データからの市民属性復元のための進化計算とSAによる2段階最適化」,システム制御情報学会論文誌,Vol. 30, No. 6, pp. 216-227, 2017.
[H10] 枡井大貴,村田忠彦,原田拓弥,「市民属性の合成手法における年齢交換による誤差最小化」,計測自動制御学会第12回社会システム部会研究会資料(グアム,3月3 – 5日,2017),pp.31-39,2017.
[H9] Tadahiko Murata, Takuya Harada, Daiki Masui, “Modified SA-based Household Reconstruction from Statistics for Agent-Based Social Simulations,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2016 (Budapest, Hungary, Oct. 9-12, 2016), pp. 3600-3605, 2016.
[H8] Daiki Masui, Tadahiko Murata, “A two-fold simulated annealing to reconstruct household composition from statistics,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2015 (Hong Kong, China, Oct. 9-12, 2015), pp. 1133-1138, 2015.
[H7] Tadahiko Murata, Daiki Masui, “Designing simulated annealing and evolutionary algorithms for estimating attributes of residents from statistics,” Proc. of IEEE International Conference on Evolutionary Computation (Sendai, Japan, May 25-28, 2015), pp. 2476-2481, 2015.
[H6] 枡井大貴,村田忠彦,「エージェント属性復元における Simulated Annealingを用いた世帯構成の最適化」,計測自動制御学会第8回社会システム部会研究会資料(宮古島,3月13 -15日,2015),pp. 167-172,2015.
[H5] 枡井大貴,村田忠彦,「統計データを用いたエージェント属性生成における誤差最小化のための進化計算手法」,進化計算学会進化計算シンポジウム2014講演論文集(広島,12月20-21日,2014),8 pages,2014.
[H4] 枡井大貴,村田忠彦,「統計データとの誤差最小化のためのSAによるエージェント属性復元」,計測自動制御学会第7回社会システム部会研究会資料(小樽,9月8-9日,2014),pp. 47-52,2014.
[H3] Tadahiko Murata, Daiki Masui, “Estimating agents’ attributes using simulated annealing from statistics to realize social awareness,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2014 (San Diego, USA, Oct. 5-8, 2014), pp. 717-722, 2014.
[H2] 枡井大貴,村田忠彦,「SAを用いた統計データからのエージェント属性復元のための目的関数の影響」,計測自動制御学会第5回社会システム部会研究会資料(石垣島,3月5-7日,2014),pp. 121-126,2014.
[H1] 枡井大貴,村田忠彦,「公開統計データを用いた世帯構成員の特徴量の進化計算的推計手法」,進化計算学会進化計算シンポジウム2013講演論文集(鹿児島,12月14-15日,2013),7 pages,2013.

Household Synthesis with Income, Industry and Working Status

[I4] 杉浦翔,村田忠彦,原田拓弥,「賃金構造基本統計調査に基づく合成世帯集団の労働者への所得の割当て」,システム制御情報学会論文誌,Vol. 32, No. 2, 10 pages, 2019.
[I3] Tadahiko Murata, Sho Sugiura, Takuya Harada, “Income allocation to each worker in synthetic populations using basic survey on wage structure,” Proc. of 2017 IEEE Symposium Series on Computational Intelligence, pp. 471-476, 2017.
[I2] 杉浦翔,村田忠彦,原田拓弥,「就業形態を考慮した合成人口の労働者への所得の割り当て」,計測自動制御学会第15回社会システム部会研究会資料(沖縄,3月14-16日,2018), pp. 179-186,2018.
[I1] 杉浦翔,村田忠彦,「産業分類ごとに就業状態を考慮した個々の世帯への所得の割当」,計測自動制御学会 システム・情報部門 学術講演会資料(静岡大学浜松キャンパス, 11月25-27日, 2017)6ページ, 2017.

Household Synthesis with Coordinate

[P5] 原田拓弥,村田忠彦,「基本単位区集計を用いた位置情報属性追加手法の精緻化」,計測自動制御学会 システム・情報部門 学術講演会資料(富山国際会議場, 11月25-27日, 2018), GS06-03 (6ページ), 2018.
[P4] 原田拓弥,村田忠彦,「SA法による仮想個票の住居への建築の時期属性の付加手法の検討」,計測自動制御学会システム・情報部門学術講演会資料(静岡大学浜松キャンパス, 11月25-27日, 2017)6ページ, 2017.
[P3] Takuya Harada, Tadahiko Murata, “Projecting household of synthetic population on buildings using fundamental geospatial data”, SICE Journal of Control, Measurement, and System Integration, Vol. 10, No. 6, pp. 505-512, 2017.
[P2] Takuya Harada, Tadahiko Murata, “Projecting Synthetic Households on Buildings Using Fundamental Geospatial Data,” Proc. of Social Simulation Conference 2017 (Dublin, Ireland, Sep. 25-29, 2017), 10 pages, 2017.
[P1] 研究会最優秀論文賞原田拓弥,村田忠彦,「基盤地図情報による合成した世帯構成への位置情報の付加」,計測自動制御学会第12回社会システム部会研究会(グアム,3月3-5日,2017), pp. 1-6, 2017.

Household Synthesis with Workplace

[W3] 福田希海,村田忠彦,「居住地と従業地の距離を考慮した従業地割当手法」,計測自動制御学会第33回社会システム部会研究会(2024年3月)
[W2] Tadahiko Murata, Daiki Iwase, Takuya Harada, Workplace Assignment to Workers in Synthetic Populations in Japan, IEEE Transactions on Computational Social Systems, Vol. 10, No. 4, pp. 1914-1923, Aug. 2023
[W1] 研究会優秀賞受賞岩瀬大輝,村田忠彦,原田拓弥,「合成人口データにおける常住地人口規模を考慮した就業者の従業地の割当て」,計測自動制御学会第27回社会システム部会研究会(オンライン,3月6-8日,2022),pp.10-17,2022.

Household Synthesis with Transportation

[T2] 堀上駿太,村田忠彦,「合成人口データを用いた就業者の通勤手段割当手法の改良」,計測自動制御学会第33回社会システム部会研究会(2024年3月)
[T1] 北下慎太郎,村田忠彦,「合成人口データを活用した就業者の通勤手段・通勤経路・所要時間の推定」,計測自動制御学会第27回社会システム部会研究会(オンライン,3月6-8日,2022),pp.101-108,2022.