會議記錄


本學期會議共13次,多於管理學術研究中心或是線上舉行。


W1-10/7

本週工作進度

前端介面直接連到後端SPARK的數據

批踢踢關鍵字統計 https://ba.cm.nsysu.edu.tw:4950/tonychuo/pttApp1a.Rmd

美妝APP

  • dtm已經完成

思考功能如何呈現 + 待完成事項

呈現工具可以做:

  • 關聯圖(雙中心網絡圖)

  • 討論熱度(聲量變化 從關鍵字統計 做List)

  • 正負情緒

  • 文字雲

  • 可以找出品牌形象(brand personality) 個人特質 > 做PCA

希望未來呈現目標

  • 【品牌個性】抓出品牌代表詞(可以看出品牌形象,可能可以多面向作pca)

  • 【競爭產品比較】可以多產品/通路/牌子 一起比較

TO-DO:

  • 暑假進度: 網絡圖還沒畫出來

  • Dictionary: 標class

W6 - 11/24 + 11/26

本週工作進度

  • 美妝文集斷句完成

  • 算出字和字的共現和相關係數

TO-DO

  • 建字典: 編成 ndoc(freq) / class / name / tooltip / alias

  • 算出字和字的共現和相關係數 建出matrix


W2- 10/15

本週工作進度

發想:

4種APP形式想呈現:

  • 品牌熱度(敘述統計)

  • 品牌比較Sna(雙中心)

  • 品牌形象(雷達圖)

  • 產品特性

TO-DO

  • DICTIONARY分類:

      • 產品 / 品牌 / 品牌形象 / 通路 / 產品特質 / KOL or 代言人

  • 品牌形象的KEYWORD在抓的時候可能會和使用者心情等等混淆,先找一下大略的向度和分法

W3- 10/21

本週工作進度

DICTIONARY分類改變:

檔案連結:美妝詞彙(美妝版詞彙_terms_select_small_2472.csv)

分類目標:2472個字

分類依據調整

  • a_tfidf >= quantile 0.6

  • n_doc >= quantile 0.6

產品 / 品牌 / 通路 / 產品特質 / 使用心得or狀態(脫妝)/使用感受(驚呼、燒到)

-> 可以改成觀察情緒或是各品牌常用的產品名稱

TO-DO:

  • 詞類分類

分工:

通路+產品特質: 上暐

產品+使用感受:岱宜

品牌+使用心得: 珮淳

W4- 10/28

本週工作進度

  • DICTIONARY分類有點模糊:

分成 - 產品 / 品牌 / 通路 / 產品特質 / 使用心得or狀態(脫妝) / 使用感受or心情(驚呼、燒到) / 使用者想解決的問題

使用感受可以是心情(分正面和負面)

使用心得和狀態是 確切使用完的心得

產品特質可以是主打的功效、或是色調

使用者想解決的問題: 像是肌膚狀態: 黑眼圈、敏感肌 等等

把字典列好之後,再合併

TO-DO

  • APP:

  1. 雙品牌關鍵字SNA

  2. 產品及品牌綜合查詢APP

  • UI介面試用

11/4及11/11 逢期中考暫停一次

W5 - 11/19

本週工作進度

  • 字典分類大致完成

  • UI設計界面可能會受到shiny app的限制

  • 品牌 通路 可能無法歸類 主要還是利用文字分析方式看出聲量

  • app要給誰看 目標要正確 多都是給行銷人員看

TO-DO

W7 - 12/3

本周工作進度

  • 參考ptt_dic_nov.R keyword建到字典中: 編列成google sheet(美妝字典)

TO-DO

    • 上暐: emotion, feature, brand 的後方開始

    • 珮淳: product, condition, brand前面, problem

  • 網絡圖初版可以先做: 岱宜

W8-12/15

本週進度

  • 字典完成

  • 網絡圖試做OK

  • 用完整的字典做出doc和sentance的MX

To-Do

  • 找出共現是0的問題 可能是alias有錯

W9-12/22+12/24

本週進度

  • sentence matrix和document matrix做好了

  • 做co-relation和co-occurrence

TO-DO

  • 檢查standard deviation在資料框內是0的,要先拿掉

  • 推斷有些字是因為在斷辭就不小心被斷開(都是多字組成的品牌名稱),用string replace處理

  • 還沒解決 但先以這個字典做網絡圖

  • visNetwork ok了

待解決的問題

  • kword 對 kword 的 standard deviation=0, 發現這些=0的字應該是空格的緣故,(文集已經處理過空格的問題) 那我們接著要改dictionary中的kword還是label欄位?

  • 句子 段落 介面顯示 kword和alias用途

W10 - 12/30

本週進度:

  • 修復APP下方文章出現功能

  1. 確定SX到底抓到甚麼

  2. 處理文章的date 並將選取出來的kword做出標記

TO-DO

  • ctag文章還不會顯示

W11 - 1/5

本週進度:

  • App點擊後可以顯示文章

  • App上線

TO-DO

文章的顏色顯示還須debug