[社團運作 & 會議記錄]

社團運作時程

2022.03.03 第一次會議

  1. 決定社團本學期走向與最終產出

  • 若需要每周推播 => 中山管院文字分析平台的教學影片+時事趨勢分析內容製作

  • 最終決議希望這學期走向較進階的內容製作(即:Shiny App),主要重質不重量,資料集則選用IMDB的電影資料。

  1. 下周的進度討論

  • Trend of genres

負責人:@廖仕雅 @鄭竹秀 @高珮瑜

之後可以做成動態泡泡圖

類似於每個泡泡是一個genre

這是老師會議上舉的例子~


  • Synergy of genres

負責人:@陳佳吟 @鄭惟謙 @陳冠如

概念類似於做類別的交互作用

電影要哪個類別搭配另一個類別票房才會高等等

之後看能不能做模型來驅動視覺化?

(資料就是用8萬多筆Movie那個物件)


下周可以先嘗試做一些敘述性統計的東西~

以確定自身對於主題的理解是否正確

2022.03.17次會議

  1. 討論前2周進度與呈現是否正確

  • 電影類別的交互作用

(1) 要呈現2種(含)以上種類與母體種類的barplot呈現方式,比較好的方式是使用橫條圖,排序後用一條豎線表示母體種類的平均票房(以表示誰低於平均票房/高於平均票房)。

(2) 除了畫平均票房的barplot,也應該在多畫一張每個種類的計數圖,過濾掉種類筆數<1,000。

(3) 若趨勢線太陡峭的話,就可以拉長年份,並把年份cut在某一個區間到某一區間

(4) 先做兩階的種類作用即可,先選一個種類作為base,比如:Action,先算出包含此種類的總平均,之後去算對其他種類而言,其他的兩階種類lift增益/遞減多少。

  • 電影類別的趨勢

(1) 同樣篩掉<1,000的種類。

(2) Panel data : yr / genre / ratio / total / average。

(3) 多做些屬性,也去思考要怎麼去將多屬性布置到一張圖上。

(3) 可以挑戰看利用動態泡泡圖將這個議題畫出來。


  1. BAP2網站內的icon失效&頁面整理

  • 若一個頁面中只有一個子頁面,則保留那個子頁面即可,日後要新增再增加頁面與icon就好。

  • 要再確認所有的連結是否已更新到最新版本,例如:管院文字分析平台、R Studio Server的維修申請連結等等。

2022.03.31次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 可以考慮一下是要抓單一類別 or 抓含有此類別的電影數量。

(2) 在計算電影數量時,要記得移除NA值(na.rm = TRUE)。

(3) 可以再多創造一些屬性,以方便從管理角度來看,講出現象或是策略建議,比如:平均成本(budget)、平均獲利(avg_gross_income)等。

(4) 不用把本身類別的點畫出來,可以直接用紅虛線代替,讓x、y軸分別擁有自己的平均基準線,方便去比較。

  • 電影類別的趨勢

本周產出內容較不完整,所以下周再來看看進度!

2022.04.14次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 抓含有此類別的電影數量比較有代表性,若單獨抓取類別的話數量會較少,沒有可比性;抑或是可以先兩種都畫出再來做比較。

(2) 不用把本身類別的點畫出來,可以直接用紅虛線代替,讓x、y軸分別擁有自己的平均基準線,方便去比較,一個類別一個x、y軸基準線。

(3) nrow(Movies)的數量要確保將沒有budget/ income的電影挑掉

(4) legend要改位置,不要遮擋圖片

(5) 開始思考從這一個主題的Shiny:APP,我們可以分析出什麼?

  • 電影類別的趨勢

(1) 主要可以往趨勢圖做,也可以多使用一些變數,例如:情緒分數,之後做出泡泡軌跡圖,再去做換x、y軸變數的Shiny:App的function。 => 所以先找尋變數 & 整理panel data!


  1. 下周放春假,暫停開會一次,4/28(四)再進行實體開會~

2022.04.28次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 左邊的Input column的layout如果再窄一點,可能會更加美觀,須待調整。

(2) 目前所做出的4象限分析,其實就是所謂的飽含策略意涵的策略管理分析,因x、y軸的不同而有不同意涵。

(3) 由於每種類別點的個數較少,所以可以在點的旁邊加上除了本身類別以外的另一類別名稱(應是用geom_text即可),並將顏色用不同的genre代替。

(4) 將平均收入+平均銷售毛利率、平均成本+平均淨收入的分析實際寫進Shiny APP,沒有問題之後下一步就可以開始進行推播~

(5) 最後再來解決x、y的lim顯示問題,目前是每個間段之間過長。

  • 電影類別的趨勢

本周針對產出情緒部分的panel data比較難以想像應該要如何去運用到資料視覺化上,故隔天再帶著code直接找老師討論!

2022.05.12 第次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 點的顏色改掉,不要粉紅色

(2) 針對兩種X、Y組合<增益率+毛利率、成本+淨收入>先去做4個象限的分析(overview),然後再去針對每個Genre去搜尋有沒有比較衝擊性的發現(即跟常理反方向的現象),也可以以成本效益方面來去分析(如果該類別再加某個類別的話,效益會最高),去寫Genre客製化的敘述

  • 電影類別的趨勢

(1)熱圖的分群解釋:所有的點到中心的平均距離是那個層級式樹的y

點投射在一個空間裡面,想辦法找出分成兩群到族群中心點的距離最小。

(2)泡泡圖的點太大,要設透明度,並且要在禮拜四以前找老師code泡泡軌跡。

(3)再增加更多的panel data,可以從情緒、話題等下手,例如:某些話題在哪個電影類別更常見。

2022.05.26次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 在本張圖的解釋當中,不能假設因果關係,只能知道這兩個變數有相關性,例如:不能說成本增加多少,利潤可能就會增加多少。

(2) 可以看到的現象是成本跟淨收入有負相關,第四象限就是高成本、低收入,而第二象限就會是比較好的選擇,非常不好的組合是thriller + romance

(3) 在闡述的時候,先講大的現象(例如:相關性)=>再敘述比較特別的組合(例如:比較出乎意料的組合、哪些電影在賠錢),一個XY組合挑比較有故事的4、5個genre,敘述太多會太像流水帳

(4) APP名稱:電影類別組合效益分析/研究,不要變換XY軸,要更改APP版面


  • 電影類別的趨勢

(1) 平均收入會因為年代不一樣,而因為通膨所以會愈來愈高,怎麼樣可以解決因年代而產生的落差問題=>相對於所有電影而言,跟當年的總收入(那個時代電影的平均income),算一個%數,平均值的平均值不是平均,所以要加權平均(每個族群不一樣大,那就要用加權平均數);當年度一個genre的平均收入/當年度全部genre的平均總收入,變成相對而言的值。

(2) 在闡述的時後,先用絕對的值去講,再用相對的值去講。

2022.06.02次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 將指導老師改成中山商業大數據平台的連結

(2) 錄影不要切邊 => 改成Open in browser錄

(3) 類別跟組合要區分清楚

(4) 不是策略是策略空間 在兩個不同的空間比較類別組合的績效

(5) 對灰色線比較基礎誤解=>應該是對所有Drama類別的平均值

  • 電影類別的趨勢

(1) 在解說動態泡泡圖時,不要想著拉動滑桿看趨勢,應該直接滑到最後,然後按play。

(2) 把趨勢相同的點出來一起看,可以先嘗試以ppt報告的方式,報告出想要解說的insight。

(3) 離群值講完後可以拉近範圍,Make sure想講的東西在這個範圍內。

  1. 其他

(1) 記得要製作影片片頭與片尾

(2) 錄完影片的人可以開始排程貼文

2022.06.09次會議

  1. 進度討論

  • 電影類別的交互作用

(1) 將策略空間全部更正至績效空間

(2) 稿子的第四個paragraph -> 這個電影類別跟其他電影類別組合的績效會有什麼差異,我們用一個互動式泡泡圖,分別在兩個績效空間去比較不同電影組合的績效。

(3) 可以在影片的最後邀請觀眾,敘述類似『這是comedy的績效空間,可以留言下方有沒有什麼其他的發現!』

  • 電影類別的趨勢

(1) 話題的熱圖與情緒的熱圖影片可以撰寫貼文、準備排程

(2) 國家相對分數的趨勢動態泡泡圖可以開始錄影