Predicting the influence of users' posted information for eWOM advertising in social networks

書名（以學術體例詳填資料，網路來源提供超連結及檢索日）：

預測粉絲留言對社群網絡中的口碑廣告的影響

Chen, Y. L., Tang, K., Wu, C. C., & Jheng, R. Y. (2014). Predicting the influence of users' posted information for eWOM advertising in social networks. Electronic Commerce Research and Applications, 13(6), 431-439.

導讀者：李欣穎

原作摘要：

粉絲曾經發表的文章內容與商品評論，一直是社群媒體用來探索創新的網路口碑廣告的策略。例如，Facebook讓行銷人員能夠利用粉絲的發文內容來自動推薦廣告。這種做法有沒有效取決於是否能準確地預測廣告對粉絲的影響力。在這種性質的廣告中，一則文章的影響力由文章內容、發表時間、作者特點等共同決定。本文提出兩個可以預測文章影響力的模型，使用發文與作者作為預測項目。實證結果表明，此模型能夠有效地預測影響力。

關鍵詞：社群網絡、網路口碑、影響、數據挖掘、情感分析

重點整理：

前言與研究方法

由於社群網絡的普及與迅速擴散，品牌一直在探索利用商品評論與粉絲發文，發展可持續的網路口碑廣告策略。許多公司已經投入鉅資研發社群媒體影響消費者購買決策。最近的研究表明，網路口碑對消費者購買決策有顯著的影響( Dellarocas et al. 2007 )。通過Gartner公司(2013年)的調查顯示，「內容行銷」是網路行銷最重要的任務，另一間調查公司PowerReviews(2011)指出，粉絲自行發表的商品評論是消費者購買決策中最有影響力的廣告工具。

為了利用這些粉絲自行發表的文章來制定口碑廣告策略，Facebook已經推出鼓勵粉絲分享自己的產品的討論和評論的工具( Harris and Dennis 2011 )。例如，Facebook允許行銷人員使用由Facebook粉絲分享的內容，自動產生廣告文章。PowerReviews也已經開發出成熟的廣告服務，讓行銷人員參考粉絲的個人資料數據，並結合他們在電子商務網站的行為資料(Wonham 2010)，這些廣告會出現在粉絲的Facebook塗鴉牆，以及在他或她的朋友們的「新聞推送」畫面上。根據估計，利用原生產品評價的網路廣告趨勢將在未來迅速擴大。

這個估計依賴三個假設：（1）由「朋友」分享的網路文章代表了一個值得信賴的來源，是具有影響力的第一手經驗；（2）某些「朋友」比其他人更具有影響力；（3）文章的數量和內容品質是一樣重要的( Yu et al. 2011 )。為了在社群網絡上發展有效的廣告策略，有必要確定一個成功的口碑流程的影響因素，並制定有效的方法來預測廣告成效與影響力。

在一般的情況下，一則發文的影響力由文章內容、發表時間、作者特質等因素共同決定。文章內容與發表時間對社交媒體的影響力已經受到大量的文獻支持。現有的研究集中在辨識有影響力的粉絲用戶與意見領袖( Bakshy et al., 2011 , Cha et al., 2010 , Kim and Han, 2009 , Kiss and Bichler, 2008 , Li et al., 2010 , Li et al., 2011 and Li and Du, 2011 )，後續研究主要在預測粉絲之間共享訊息對社群網絡的影響，並提出有效的預測模型與方法( Adamic et al., 2008 , Bian et al., 2009 , Cao et al., 2011 , Hong et al., 2011 , Ratkiewicz et al., 2010 , Suh et al., 2010 and Yu et al., 2011 )。此外，一則文章的影響力是依照用戶做出回應的情況來判斷，如「喜歡」的數量往往是衡量點擊數( Yu et al. 2011 )、瀏覽數( Ratkiewicz et al. 2010 )、以及分享數( Hong et al. 2011 )。

為了保證在使用上社群網絡上的廣告效果，我們需要一個精確且令人滿意的指標，來預測廣告影響力。有效的預測模型包含三個組成部分：目標變量的定義、預測的選擇、預測的形式與功能。本文將討論與建立這些組成。

有一件事是顯而易見的：一則貼文的影響力會被低估，當它接收到較少用戶的討論，但其實它獲得的市場反應十分良好。預測模式必須充分反應一則文章的目標變量。因此，本文首先依據用戶和其他人連結的人數多寡來進行加權。然後，我們將一則文章底下與之展開互動的人，把他們的加權分數進行加總，定義成一個「影響力指數」。

為了鑑定用於預測的預測模型，我們建立了兩份預測特徵列表。第一份列表是藉由文獻探討，預測文章內容對影響力的影響。第二份列表是本文基於自己的研究，定義出影響力分數的指標。

使用這些預測方式，本文提出了兩種預測模型。第一個是多元回歸分析統計工具。多元回歸分析是用於描述目標和預測對象之間的關係的線性圖案。為了實現更靈活的預測方式，我們也提出了一個基於五種技術，包括四種數據挖掘方法的結合：神經網絡、決策樹、Naive Bayes和Support Vector Machines (SVM)等統計方法，再加上logistic回歸。

資料輪廓

我們想要調查預測特徵和影響力分數之間的關係。我們選擇了一個Facebook用戶，並蒐集他所有的朋友的文章。在數據蒐集階段，我們排除了廣告和機器人帳號發佈的文章。這樣一來，我們從31位朋友獲得總共510篇發文。這些朋友年齡範圍為21至32歲，平均年齡為24.9歲。朋友社團的數量為1至254個，平均為48.6個。510篇文章中，244篇是由女性發表、266篇是由男性發表。510篇文章中，139人是在週末發表，其他人在週間發表。每個人的文章數為2至47篇，平均值為24篇。每個人的朋友數量從153到651位，平均為307位。

我們使用中文知識信息處理（CKIP）實驗室系統進行文字處理，這是由台灣中央研究院提供的線上中文分段、分詞服務。使用NTUSD中文字典( Ku et al. 2006 )，其含有2812個正面和8276個負面詞彙( Ku et al., 2007 and Tan et al., 2008 )，用來辨識正面或負面的情緒。為了分析停用字詞的數量和文章的影響力分數之間的關係，我們按照中國標準停用字詞列表中的共同停用字來標示停用字。本文並計算使用標點符號的次數與比率。最後，我們利用「喜歡」的加權和每個文章的點擊次數來計算影響力分數。

圖。2。

數據蒐集過程

討論與結論

Table 3.

本文的預測模型中的指標考慮名單

類別類型特點定義

內容長度長度文章的字數

情感詞 num_positive 正面詞彙的數量

ratio_positive 正面詞彙在文章中的比率

Positive 1/0 正面詞彙在同一作者文章中的平均數量

num_negative 負面詞彙的數量

ratio_negative 負面詞彙在文章中的比率

Negative 1/0 負面詞彙在同一作者文章中的平均數量

標點符號 num_question 問號的數量

num_exclamation 驚嘆號的數量

ratio_punctuation 標點符號的使用頻率

媒體超連結文章中包含的照片、影片或連結

停用詞 num_stpword 停用詞的數量

ratio_stopword 停用詞的出現比率

標籤 post_tags∗ 標籤的數量

時間 Day∗ 週末或週間

Time∗ 半夜、早上、下午、晚上

作者個人性別Gender 作者的性別

年齡Age 作者的年齡

結構 friendCount 作者的朋友數量

friends_total_weight∗ weight∗ 作者的朋友的朋友數量

ratio_of_high_weights_friends∗ 作者好友權重

avg_like∗ 作者得到的按讚數平均

avg_comment∗ 作者得到的按讚數平均

photo_tags 作者照片被標記的次數

活動 postCount 發佈的文章數

Photos 發佈的照片張數

Groups 加入的社團數量

Table 6.

指標和影響力分數之間的相關性分析

指標影響力分數影響程度劃分為三個層次影響程度劃分為四個層次

Link −0.097⁎

−0.110⁎

−0.091⁎

num_positive 0.076 0.099⁎

0.068

num_negative 0.148⁎⁎

0.134⁎⁎

0.129⁎⁎

num_stopword 0.152⁎⁎

0.162⁎⁎

0.150⁎⁎

num_exclamation 0.053 0.052 0.051

num_question −0.006 −0.032 −0.035

Length 0.181⁎⁎

0.161⁎⁎

0.158⁎⁎

ratio_positive 0.004 −0.008 −0.005

ratio_negative −0.030 −0.028 −0.043

ratio_stopword −0.014 0.001 0.009

positive 1/0 0.085 0.085 0.076

negative 1/0 0.096⁎

0.085 0.074

ratio_punctuation −0.043 −0.047 −0.052

Age −0.057 −0.031 −0.053

Gender 0.011 −0.001 −0.009

Groups −0.073 −0.085 −0.062

Photos 0.163⁎⁎

0.131⁎⁎

0.149⁎⁎

photo_tags 0.016 0.004 0.001

friendCount 0.276⁎⁎

0.223⁎⁎

0.263⁎⁎

postCount −0.109 −0.082 −0.096⁎

Day 0.040♦

0.065§

0.076§

Time 0.095♦

0.219§

0.156§

post_tags 0.078 0.061 0.100⁎

avg_like 0.563⁎⁎

0.482⁎⁎

0.519⁎⁎

avg_comment 0.210⁎⁎

0.203⁎⁎

0.225⁎⁎

friends_total_weight 0.218⁎⁎

0.169⁎⁎

0.208⁎⁎

ratio_of_high_weights_friends 0.137⁎

0.113⁎

0.148⁎⁎

⁎p < 0.05.

⁎⁎p < 0.01.

作者將影響力分數分為幾個區間( MacQueen 1967 )，是為了更清楚的分割影響力分數的預測效果。

影響程度的定義。

影響程度劃分為三個層次劃分為四個層次

1 0≦影響評分<2.0 0≦影響評分<1.5

2 2.0≦影響得分<6.0 1.5≦影響得分<4.5

3 6.0≦影響力分數 4.5≦影響得分<6.5

4 N / A 6.5≦影響得分

實務應用

根據這些研究結果，我們提出以下建議，企業可以據此開發基於社群媒體平台有效的廣告策略：

1.選擇一個網路口碑進行廣告，可以通過一個高度複雜的數學模型，來預測廣告效果的精確滿意程度。為了開發有效的預測模型，目標變量必須充分反映該發文的影響力。我們建議，為了避免低估或高估文章的影響力，必須共同考慮文章內容和發文作者的影響力。目標變量的定義可以根據用戶連接的人數來加以進行權重，以反映用戶的影響力。然後，一篇文章的影響力可以被定義為對文章作出回應的人民的權重之總和。我們還建議從幾個指標，包括作者、與內容相關的功能，以及平台的其他功能，例如時間信息、媒體類型和創建時間，來對一篇文章進行影響力得的預測，從而策劃一個成功的廣告策略。

2.文本挖掘方法和專用工具，例如情感分析，可以用於分析文章內容來產生有用的預測功能。本文從情感分析所得的幾個特點，如「number_negative」、「ratio_negative」、積極與否，以及「number_positive」，都被確定為有用的預測指標。雖然這些確切的指標可能無法直接適用於其他的應用程序，但它提供了分析口碑時可以使用的新方法，並可以用來制定有效的網絡行銷策略。本文的發現是發展一種高度精確的預測模型，其中文本挖掘技術與計算效率特別重要。

3.影響力分數和預測之間的關係可能是複雜的。本文使用先進的學習工具以捕捉非線性關係。對於連續分數的計算，常用的方法包括神經網絡、回歸樹，和支持向量。對於離散的分數的計算，在本研究中使用了四種方法：分類樹，Naive Bayes和Support Vector Machines (SVM)。這些方法已經在幾個工具中被納入，如SAS Enterprise Miner中和IBM、SPSS Clementine。結合多種統計方法的預測模型可以產生最終預測。

研究侷限與未來研究方向

這項研究有幾個限制，可以在今後的研究中加以改進，並加強其成果和理論意義。首先，數據大小和使用者的多樣性可能不足以完全支持該結論。未來，研究者可以利用Facebook的API來獲取更多數據，包括種族、民族和社會經濟背景。其次，除了那些點擊「喜歡」的數據之外，回覆文章或轉發文章的數量也可能代表其影響力。未來還可以考慮其他類型的資料，如作者和讀者對文章內容的影響，以及指標之間的相互作用。最後，我們可以增加預測模型的彈性，將整體模型通過分配不同的權重加以分類，並且可以使用神經網絡，以找到能實現最佳預測性能的權重。

使用社交網絡口碑的策略已經成為廣告行銷的新典範。在短期內，我們計劃研究不同類型的文章，其作者與讀者之間的相互作用。此外，我們將調查回應後（包括轉發、評論、回覆或其餘正面或負面的聲明，表示不同程度的支持）的其他預測形式。

與本研究問題意識相關的概念與延伸對話：

本文提供社群內容分析的研究步驟參考：

1. 根據參考文獻列出內容分析的類目

2. 根據不同平台的數據自行設計類目

3. 依據不同資料集的特性，尋找新的文本分析類目

延伸閱讀：(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)

無

資料狀況：

■電子檔（摘要／全文）:

□ 紙本（摘要／全文）:

□ 其他狀況：

如有重要相關圖表及附件請附在本頁後面，並在「其他狀況」項目內註明，如：附圖二張。

預測粉絲留言對社群網絡中的口碑廣告的影響Predicting the influence of users’ posted information for eWOM advertising in social networks.docx

Google Sites

Report abuse