带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

數據采集與挖掘:香水產品賣點深度挖掘分析,并給出一些營銷建議

原創 4 收藏 評論
舉報 2018-04-28

一、香水數據處理

數據來源于某電商網站的香水產品的數據,包括了香水產品的商品名稱、產品毛重、商品場地、包裝、香調、凈含量、分類、適用性別、適用場所、價格,以及評價數這幾個維度,總共1009條數據:

1.jpg

從上圖可以看出,這部分數據存在一定數量的缺失值,還存在例如“性別適合場所”、“評價”兩個不規范的數據維度,需要對這部分數據做規范化處理。

針對“評價”,這個維度的數據包含中文和數字的混合,末尾還有一個“+”,“+”很容易通過excel來替換掉,但是將“萬”轉化成準確的數值結果采用excel比較難做到,因此采用python來處理來處理;

“適用場所”字段包含多個場所,要先算出所有記錄的場所合集,這部分也用python來實現。最終分解成“旅行”、“其他”、“約會”、“情趣”等8個字段,其類型是0、1類型,若該香水產品有對應的適用場所,則設置為1,否則設置為0;

接下來還需要對香水的價格和評價數據做離散化處理,將價格等間距分為6個等級,分別是低、較低、中等、較高、高、非常高;同樣的,也需要要評價數做同樣處理,分為7個等級;

最后還需要將中國大陸、廣東、浙江義烏等國內地址統一替換成中國,并且增加“適用場景數量”字段,統計不同香水適合的場所,最終如下圖:

2.jpg

二、香水數據分析

對香水產品的價格做描述分析,約92.43的產品價格在900元一下,最大值為2212元,在樣本中可以查詢到對應產品為香奈兒/機遇/黃色邂逅女士香水50/100ml/持久淡香精EDP EDP100ml。

3.jpg產品的評論說在一定程度上代表了產品的銷量,因此此處用產品的評論量來代替產品的銷量。對所有產品的銷量做統計分析,發現香水產品的銷量兩級分化明顯,有58.47%的產品銷量不足1000,有約10%的產品銷量大于10000,其中最大值為100000以上,為菲拉格慕香水:

4.jpg在過濾掉存在的缺失值后,可以得到商品場地的分布圖,在下圖中法國占據了絕對比例,約為49%,德國和西班牙的香水種類比較少,分別為3.89%和3.97%。

5.jpg

由于商品的評價數跨越范圍比較大,且商品銷量的兩級分化嚴重,如果直接用評價數來繪制箱型圖做分析,會產品大量的離群點。因此對商品的評價數以2為底做對數處理,再按照各個字段對“評價對數值”做分析。

下圖是用箱型圖描述各個產地香水銷量分布,與其他國家的香水產品相比,西班牙和英國的香水產品銷量明顯偏低,其他國家并沒太大的差別。

6.jpg

下圖是各包裝香水銷量箱型圖,可以看出組合香水的整體銷量要高于其他包裝的香水,因為組合裝的香水往往比較齊全,并且比較優惠,對價格敏感的消費者有較大的吸引力。而限量版香水的銷量明顯要低于其他包裝的香水,主要原因是由于限量版香水的發行量少而且價格較高。其他品包裝的香水銷量并沒有明顯的差別。

7.jpg

將不同香調的香水銷量做分析,可以看出花果香調和混合香調的香水產品整體的銷量要略高于其他香調的香水,而東方香調和其他香調的香水整理銷量偏低。東方女性使用香水的習慣教西方女性保守,味道偏好輕盈簡單的清淡味道,因此花果香調的香水賣得最好。木質香調等較濃郁的香水遮蓋體味功能強,比較適合西方人。

8.jpg

在凈含量方面,包裝較小的產品銷量比較高,包括1-15ml、16-30ml、31-100ml。包裝小的產品便攜性強,而且我國大部分的香水使用者使用需求并不如歐美國家的消費者高,因此偏好小包裝的香水。而101-200ml以及200ml以上規格的香水,不方便攜帶,而且如果不及時使用完畢,會有變質等問題。

9.jpg

按照分類分析,淡香水EDT和濃香水EDP的銷量好,主要是淡香水味道清淡,符合東方女性的消費特征;濃香水主要是針對年紀較大的商務女性和中年女性,也有一定的市場。

10.jpg

接下來對影響香水銷量的因素做決策樹分析,對香水的適用場所做關聯分析,對香水總體做聚類分析,具體如下面的流程圖所示:

11.jpg


三、影響香水銷量的因素分析

這部分的主要目的是分析各個因素對銷量的影響程度。需要對這部分的數據做過濾篩選,剔除出缺失值,并且過濾掉包括商品名稱、適用場所、價格、評價等維度,針對商品產地、包裝、香調、凈含量、分類、性別、適用場景數量、價格等級、銷量等級這幾個維度做分析。

12.jpg


這部分采用C5.0決策樹算法分析,挖掘影響香水產品銷量等級的因素。可以得到下圖。在影響產品銷量的因素中,適用場景是最重要的,其次是商品場地、香調和分類,包裝、凈含量、價格等級、性別影響比較小。

13.jpg

通過決策樹分析,可以得到一些結論(這部分就省略了,留在給小密圈的伙伴分享了,哈哈大笑)。

14.jpg

四、香水適用場所關聯分析

這部分是需要對香水適用場所做關聯分析,需要對數據做預處理,這里我們根據之前的處理生成了不同的8個字段,將含有該類型適用場景的值設置為1,否則設置為0,同時需要對不需要參與分析的字段做過濾處理,最終得到:

15.jpg

進行關聯分析的時候,采用Apriori算法,將最低條件支持度設置為75%,最小規則置信度設置為95%,最終得到12條關聯規則,如下圖:

16.jpg

五、香水聚類分析:

對香水產品做聚類分析,將商品產地、包裝、香調、凈含量、分類、性別、使用場景數量、價格等級、銷量等級作為聚類分析對象,如下圖:

17.jpg

經過初步的測試,這里將聚類的模型的聚類數設置為5,因為如果設置為4類,那么最終得到的聚類質量較差,而且其中預測變量重要性最高的是香調,但得到的類別區分度不高,差異不明顯。

當聚類數設置為6或者更高時,雖然聚類質量有所增加,但并不明顯,區分過細,容易出現過擬合的情況,結果也沒有意義。

18.jpg

19.jpg

如上圖所示,預測變量最重要性依次是分類、香調、凈含量、產地、性別、包裝和適用場景數量。其中,分類是聚類的主要依據,而適用場景數量則是對結果影響最小的因素。

本次聚類的之類相對比較良好,平均silhouette為0.2。經過對數據的分析可知,在進行聚類時,數據分布不均,例如,同一種分類的香水,可能含有不同的凈含量、也可能來自不同的地方。因此本次聚類分析中涉及的香水大致可以分為5類。

六、初步的營銷建議(大致思考):

綜合上述分析,對于希望提升銷量的商家來說,在銷售的香水產品的選擇上,需要選擇消費者歡迎,總體銷量好的產品:

1、制定價格方面,商家可以將產品價格定位在大眾消費品的水平上,并保持正常利潤空間,更多考慮運用價格策略擴大產品銷路,吸引更多消費者。具體來說,淡香水EDT的銷量與價格呈現負相關,而濃香水EDP的銷量與價格呈正相關,說明濃香水的買家比較重視品質,對價格不敏感,而淡香水EDT的買家對價格敏感,因此對于不同類型的產品要有具體的價格策略;

2、產品分類方面,香水的產地、香調、凈含量都會對銷售產生很大的影響,因此選擇正確的類型的香水是提升銷量非常重要的方面,法國、意大利是世界上最重要的香水奢侈品產地,有著巨大的影響力……

3、銷售策略方面。由于消費者在購買香水的時候體現了明顯的價格敏感性,價格低的香水產品銷量更好。另外,目前我國香水消費中很大一部分你還是作為禮品,因此,可以制定一個短期促銷策略,降低價格……

歡迎關注我的微信公眾號:

個人微信公眾號二維碼.jpg

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 汾阳市| 扎赉特旗| 孟州市| 亚东县| 玉门市| 孝昌县| 维西| 平遥县| 鄄城县| 徐水县| 铅山县| 双鸭山市| 梓潼县| 通海县| 玉山县| 宜州市| 东源县| 昆山市| 绍兴市| 旅游| 古田县| 凤凰县| 襄汾县| 耒阳市| 台安县| 托里县| 东光县| 连城县| 永年县| 浦北县| 荣昌县| 迁西县| 延寿县| 望都县| 太仆寺旗| 扶绥县| 牡丹江市| 旌德县| 遂宁市| 托克逊县| 宜兰县|