如何從 “用戶評論”中挖掘業務價值
2019-06-21 11:26:18
次
2019年電商依然是消費增長的主力軍。今年前5個月,我國網上零售額總額達到3.86萬億元,在社會消費品零售總額中占比超過1/5。剛剛過去的618購物節,各個電商又再次刷新了自己的平臺銷售記錄。電子商務成為我們消費者選購商品的主要平臺,而購買后填寫評價也是很多人的習慣,這些評價可能是分享喜悅夸獎物有所值的,也可能是是吐槽不滿的。這些或長或短的文字,包含了用戶對于產品或者服務的認可與接受度。
產品或者服務的提供商或者銷售商,如何通過這一條條的評論來解讀用戶想法,作為后續產品與服務改進或者營銷策略優化的重要參考依據。針對這些非結構化的用戶評論的分析與解讀,我們需要借用“文本分析”的方法來完成。
文本分析的本質是從給定文本中獲取高質量、有用信息的自動化過程,其一般步驟為:數據采集、數據清洗、文本挖掘分析、可視化分析。
評論數據一般為消費者對特定商品的評價或是社會大眾對新聞事件的評論,信息通常分布在網頁中,一般采取爬蟲的方式獲取數據。評論數據多為非正式的書面評論,存在諸多非法字符比如表情、符號等,往往需要通過數據清洗完成數據的規整。清洗后的數據可以基于自然語言處理相關技術(詞法分析、句法分析、信息抽取、主旨話題模型)進行分析;文本分析結果可進一步結合數據的元信息做場景化的可視化面板展示。
評論數據作為用戶問題、建議、態度的載體,對產品評估和改進優化極具價值。對于用戶評論數據,我們可以通過文本分析解讀用戶的關注焦點、主要討論話題、用戶的情感傾向,以及主要評論的主體對象等。小T以某電商手機的用戶評論為例,通過對用戶評論的進行分析,獲取客戶對于手機相關評價,為手機設計優化提供參考和依據。
評論焦點分析-獲取評論關鍵詞
評論焦點分析通過關鍵詞抽取技術實現關鍵詞獲取,并通過統計關鍵詞的詞頻大小獲取評論焦點的熱度,具體挖掘流程如下所示。首先基于詞法分析做評論的分詞和詞條的詞性標注,文本過濾篩選符合關鍵詞搜索域的詞條,比如,名詞、動詞、形容詞等,接著基于關鍵詞抽取技術抽取關鍵詞,最后,對關鍵詞做詞頻統計并基于詞云圖展示評論熱點評論焦點。
經過上述挖掘流程完成評論焦點抽取,如下是關鍵詞抽取的結果示例:
統計關鍵詞詞頻并基于詞云圖進行展現,以手機評論為分析場景,則可以看到:評論的焦點集中在手機電池是否耐用、手機外觀、系統流暢性、手機拍照清晰度等方面。
評論話題分析-獲取評論主題
每一條評論都圍繞一個或幾個核心主旨進行闡述,這個核心主旨就是評論的中心思想。基于主旨話題分析技術獲取文本主旨,每一條評論可能包含多個主旨話題,每一個話題包含多個主題詞,通過評論的隸屬度確定評論所屬的主旨話題,通過主題詞的分布確定主旨的含義。評論話題的具體分析流程如下,此過程要依次進行詞法分析、文本過濾、主旨話題分析:
基于評論文本構建主旨話題分析模型,模型結構如下所示。根據每個話題下的主題詞的分布可以確定主題的含義,比如:外觀、電池等,分別給每個主題注明主題含義。
完成上述主題模型編輯后,基于主題模型對評論文本打標簽,即給出每條評論文本的話題。
評論情感分析-獲取用戶情感傾向
評論文本中往往帶著評論者的主觀情感色彩,這些積極、中性或消極的評價表達了評價者對產品品牌的態度傾向。基于情感分析模型,能夠分析出評論中的情感色彩;具體的挖掘流程如下,依次進行詞法分析、文本過濾、情感分析。
情感分析完成每一條文本的情感預測,得出用戶評論內容是積極、消極還是中性:
評論觀點抽取-獲取評論觀點
評論文本往往會在不同的關注點上表達評論者對某一要素的看法,即評論者秉持的觀點。觀點由評價對象和評價構成,以“手機外觀漂亮”為例,則評價對象是外觀,評價是漂亮,評論觀點往往代表著評論者的關注焦點及其情感。基于句法分析結合觀點規則實現對評論文本的觀點抽取,此過程對評論依次進行詞法分析、句法分析、觀點抽取。
在抽取觀點過程中,可以指定評價對象,進而有針對性的抽取指定對象的評論觀點;比如:抽取拍照、外觀、電池、系統、性價比等評論對象的觀點,抽取出的觀點如下所示:
基于評論觀點做詞頻統計,進而發現熱點評論:
評價對象抽取-獲取評論對象
面對一系列的評論數據,每一條評論關注點不盡相同,比如:針對手機的評論,有些人關注外觀、有些人關注性價比、有些人關注拍照等,基于信息抽取技術可以實現對評論對象的抽取,抽取結果如下所示:
基于文本挖掘分析可以獲取諸多信息,將挖掘獲取信息和數據的元信息相結合做可視化分析,更能夠直觀分析用戶評論隱藏的規律。以下是小T列舉了“可視化分析+挖掘分析”的示例,基于不同的分析維度可以窺探到更多的市場訊息。
將年齡與評論話題相結合:基于評論話題分析結果結合評論者年齡分布做可視化分析,分析不同年齡段用戶對手機關注維度的區別:
將品牌與情感分析相結合:基于情感分析結果結合各手機品牌信息可分析不同品牌的市場歡迎度(小T特別強調:僅為分析示例,不代表真實情況哦):
通過以上分析,我們將原本難以解讀的非結構化文本數據轉化為“結構化數據”,借用可視化方法更直觀地解讀用戶評價。為手機制造商與銷售平臺提供業務決策參考依據。
基于文本分析的“用戶評價”解讀,已經廣泛應用于多個行業和領域,零售、金融、旅游、政務……只要能夠獲取到評論內容的載體平臺,都可以通過對評論文本的解讀,來實現自身產品與服務的優化、營銷與競爭策略調整、精細化管理等。
而要實現用戶評價分析,如果您的數據量不是很大,熟悉機器學習算法如R語言或Python等,可以采用編碼的方式實現。如果您的數據量較大,分析完成后還需要與業務應用系統相融合,那么小T給您安利一款簡單好用的AI建模工具,不需要復雜編碼,簡單拖拽就可以實現以上分析。來張圖感受一下:
這款工具就是美林數據自主研發的Tempo大數據分析平臺,是一款集數據接入、數據處理、數據挖掘、數據可視化、數據應用于一體的軟件產品。它秉持“智能、互動、增值”的設計理念,面向企業級用戶提供自助式數據探索與分析能力,為企業提供從BI到AI的一體化數據分析與應用解決方案。
不僅可以進行文本數據分析,還支持上百種機器學習算法,可以滿足多種業務分析與建模需求。是一款安全自主可控的優秀國產數據分析與應用軟件!