自分と、12分以上の人などを除く23人を集計、目安は8分程度だったと記憶
申告時間の平均などと分布(単位はmin)、切り上げているので実際はこれより期待値でみて30秒少ない(という想定)、
ex)自己申告1min→実際には[0,60]sec
mean(na.omit(df$sinkoku)) [1] 5.7
median(na.omit(df$sinkoku)) [1] 5.5
実際の演奏時間に関して、外れ値が・・・
mean(na.omit(df$Time)) [1] 6.083333
median(na.omit(df$Time)) [1] 6
差の分布と平均など。25秒程度自己申告よりオーバー
mean(na.omit(d)) [1] 0.365942
median(na.omit(d)) [1] 0.5
外れ値の問題の人を除くと5秒オーバーとめちゃ高精度
mean(na.omit(d[d<4]))*60 [1] 5.227273
奏者が弾き終えてから次の人が弾き始める間隔(秒)、低い方と高い方で二分
mean(tmp) [1] 67.1875
median(tmp) [1] 60
開始から1順終了で193min、休憩8min,25人
演奏間隔いれて平均7.4分
間隔は60秒なので、8分程度を制限とした時に全体からの推定は6.4分、外れ値(極端に長い人)を除くと6.1分、直接による推定は6.1分
一部から全体を推測するのは外れ値をのぞけばかなり良好で、暴走ボケ老人みたいなのを除けば自己申告はかなり有効
今後は
最大(目安)時間
実際の1人あたりの時間
をとり、明らかな異常値はカットすれば、一部の傾向からトータル時間の予測を高精度で立てられる。
演奏時間〜f(申告時間、レベル,….) などとモデリング
人iの制限時間に対する割合 p_i に適当に事前分布をいれて、 t_i=p_i* 目安制限時間 とし Σ_i t_i = トータル演奏時間 などとうまくやれば、一人ずつの時間を測らなくてもp_iを推定可能