マンガを読む人工知能によって得られたメタデータから,登場人物・舞台・台本(セリフとト書き)の3つの構成要素からなる情報をつくる.
登場人物はあらかじめ3体の3Dモデルデータが用意されている.脚本で得られた情報を元にして,性別と年齢から適切なモデルを選択する.同時に音声も割り当てる.
登場人物の人数に応じて決まった位置に3Dモデルを配置する.4人以上は配置されない.背景や空間情報が取得できていないためである.
先に登場人物のセリフを音声合成ソフトをつかってファイルとして生成する.同時に最終動画の時間が決まる.
音声合成ソフトによって決まった時間の長さに応じて,登場人物の表情や姿勢を変更させて画像を生成する.