目錄
「一線」:新人和老人關于數據思維的50個區別
「數說」:我在B端做數據分析
「準繩」:2022,【算法】屬于人民
「彩蛋」:
二零二二
新人和老人關于數據思維的50個區別
「10多年前自己以新人的身份開啟數據生涯,現在算是一個數據老人了,與當初的自己相比,現在看數據的視角發生了很大的變化,這里列出了50條關于新人老人在數據認知上的可能的差異,希望能帶來些啟示。」
(為了排版美觀,我將原文整理成了下列表格,方便觀看,畫幅受限,點擊圖片可放大。編者注)
文章轉自與數據同行公眾號,作者傅一平
鏈接://mp.weixin.qq.com/s/Qq6ZejiaEO7iHb-i3rGYNg
以上是一家之言,有機會跟大家聊數據治理、數據技術的新老人的思維差別!
我在B端做數據分析
數據分析工作就是從一堆看似雜亂無章的數據中找到有用的價值,工作也是如此,越做越清晰。本文作者從他過去的B端數據分析工作中總結經驗,和大家分享,一起來看一下吧。
一、寫在前面
最近也越來越喜歡Dambisa Moyo的這句話,
“The best time to plant a tree was 10 years ago. The second best time is now.”
我是西索,距離2011年6月22日,到現在是真正意義上做了十年數據分析,十年前沒有種好樹,十年后我想重新開始積累。工作之后的前兩年是面向于C端的零售行業,余下的八年都沉浸在B端領域里面,研究數據增值、變現的場景。
二、為什么要寫這篇文章?
前一陣子在[一個數據人的自留地]群里發了一個問題:
對于to B的公司,要不要做企業畫像? 如何做企業畫像? 結果一石激起千層浪,大家討論非常熱烈。原來一直以為用戶畫像在to C的公司用的比較多,沒想到服務B端的企業也有這么多人在關注,大家一致認為企業畫像是有必要的。然而大家的分歧在于:如何做?人肉做,還是大數據,是否需要用到大數據?
和simba大佬聊完之后,大佬出了一系列文章,分享了如何做B端的畫像。看完之后產生了一些感觸和想法,C端的分析案例一搜一籮筐,但是B端的案例是真的少。
simba:一篇文章讓你掌握企業畫像
老實說,數據就是一團漿糊,越攪越糊,至今還沒怎么真正把數據的價值和意義搞懂,每天一個踩坑知識點,過山車一樣的刺激,懂的人自然懂。于是就想把過去在B端里面的分析場景整理出來進行分享,一方面給過去這十年做一個簡單的復盤,另一方面也看看能不能得到一些共鳴,產生新的idea,歡迎私信來交流。
做數據,欲速而不達,慢就是快,需要穩扎穩打把脈絡理清楚,后面在應用的時候就會清晰很多。
三、B端的數據,得看的遠管的寬,才顯專業
在B端做分析,時刻記牢的幾個關鍵要素:“營收”、“影響”、“知名度”。
首先必須是“營收”,區別于C端消費,B端的決策周期長,從觸達到產生訂單之間的過程很難做歸因,對數據而言,獲取線索比直接看;
然后才是“專業”,需要對生意、行業、企業經營、業務(市場、營銷、供應鏈倉儲物流、商品、運營、客服、研發)上的概念有比較全面的了解,否則很難和業務保持在同一個溝通層面,很容易被評價為不懂業務;
再后就是“方法”,在B端如果能往外延伸觸達到客戶,所接觸到的對象非富即貴,不是老板就是高官,不同的場合下用的“道”、“術”、“器”都進行區別,變則通,見人說人話,見鬼說鬼話;
3.1 這些B端業務上的一些核心業務指標,老板們都喜歡看
合同金額、付費用戶數、付費轉化率、用戶客單價、用戶流失率、商機線索量、市場占有率;
3.2 這些B端業務上的一些主要分析場景,領導們都喜歡聽
面向市場的競品分析,幫助營銷找線索,競品的主要客戶群體、競品的客戶群體特征(區域特征、行業特征)、競品客戶群體的財務情況、目標客戶的背景、目標客戶的喜好;
面向客戶的運營分析,幫助客戶找它的經營問題也是平臺的切入點,客戶的整體市場規模、主要客源渠道分布、主打產品的地域差異、潛在的市場機會;
面向產品的用研分析,幫助產品快速定位提升優化體驗,產品使用過程中的埋點行為分析、用戶獲取留存和流失、核心業務鏈路的使用情況監控;
面向管理的經營分析,幫助管理層更好的了解業務線現狀,從財務分析的視角研究業務上的商業數據模型、多業務視角下的業務分析報告、新增市場新增產品新增用戶研究;
面向質量的問題分析,幫助所有人認清客觀的事實,從客服角度觸發,把用戶的訴求、投訴、建議、反饋等信息和業務數據串聯起來,從用戶視角去剖析產品、業務環節的質量問題;
本文轉自人人都是產品經理 作者 @鄭小柒是西索啊
鏈接://www.woshipm.com/data-analysis/4862152.html
3.3 這些B端業務上的一些主要算法場景,同事們都喜歡吹
基于標簽的推薦算法,需要根據標簽、用戶偏好、商品信息建立混淆矩陣,召回商品集合,生成差異化的規則和策略;
基于商品的類目預測,需要從商品的類目、品牌、型號、規格、屬性等信息,建立分類模型;
基于交易的趨勢預測,需要從市場大盤、行業趨勢、單品交易等維度,建立預測模型;
基于市場的供需模型,需要從供需雙方的頻次、需求量、供給量等層面,建立供需模型;
基于用戶的漏斗分析,需要從渠道來源、訪問、頁面瀏覽、模塊點擊、加購收藏、點擊支付等鏈路,建立漏斗模型;
基于運營的畫像分類,需要從用戶、商品、交易、行為、風控、市場等粒度下,對用戶建立標簽;基于路徑的最優模型,需要對地理位置、行車路線、配送路線、倉庫建設等場景,建立基于時間、空間的最優模型;
基于風險的風控模型,需要從履約、違約、訴訟、行政處罰、刑事處罰等風險場景,建立風控模型;
基于客服的語義模型,需要對用戶訴求、電話咨詢、機器人問答、人工客服等場景,建立NLP模型;
四、說下B端常見的一些用戶分類
對于絕大多數B類用戶的研究,接觸到的對象一般都是以中小型的B端公司為主;只有在KA用戶里面,有少部分是真正大規模的企業、品牌商,這類公司的組織形態又極其復雜,可能所對接的業務只是貴司其中很小的一個模塊而已。
五、說下B端常見的業務類型
產品是B端業務的根本,市場開發是業務營收的關鍵,而服務是業務穩定增長的核心。
做產品,深挖客戶需求形成產品建議,包裝產品方案進行技術演練,豐富產品適配場景提高通用性;
做市場,對線上線下營銷活動資源進行整合,建立線索的收集、反饋通道,快速感知用戶的訴求,并提供產品應用解決方案;
做服務,保障產品實施交付,提供同步的指導培訓,復盤客戶業務現狀、應用實踐案例,形成業務解決方案,以驅動產品和營銷方案的升級,促成用戶續約;
通過服務擴散產品價值增益,維護老客的穩定接觸,建立市場口碑,吸引更多的新客戶。
六、對比B/C端數據的一些特征
不同的業務下,產品模式不一樣,在結果體現上區別就會更大,以至于有很多業務線上的數據量級極小,甚至于根本談不上大數據分析,就更談不上所謂的算法和工程。
需求層級上:因為是垂直領域,對接的也是企業級之間的供給關系,所以從動機上來說,考慮更多的部分是商業模式和生態玩法,而不是單一的購買意向;
數據量級上:沒有C端規模那么大,無論是用戶群、產品使用、流量、需求;
產品架構上:受制于用戶群體,B端的產品分類目標導向性會比較強,工具類型產品、平臺類型產品、服務類型產品;
畫像分層上:做的好的B端企業一定都是垂直細分領域,所以用戶群體相對單一,畫像更多的是在細分用戶的精準性區別上,標簽多來自于產品和系統本身;
合作方式上:B端之間的合作一旦達成,往往都是強依賴關系,具象一點,拿交易舉個例子,C端消費的交易達成一般是訂單,B端合作的交易達成可能是訂單、也可能是合同、還可能是商業合作(短、中、長);
盈利模式上:B端的盈利模式,服務費、傭金、返點、合作費用、廣告投放費、會員費、線下活動入場費、培訓費、咨詢費等;
決策模式上:B端明顯會偏向于多人決策、關鍵核心人決策,找準人找對人才是關鍵;
七、用戶-業務-產品-數據,才是好的鏈路順序
通過下表,對比下B端和C端之間的場景差異。
7.1 用戶差異
7.2 業務差異
7.3 產品差異
八、社會才是最好的大學,都會有起有伏
每個人在離開學校,踏入社會的大門開始,都會經歷很多個成長周期。在傳統行業的產品管理中,有產品生命周期的一套理念,套用到職業生涯,應該也是可以的。
7.5 數據差異
e.g 以salseforce 為例,對于它的產品周期:
1. 最早提出SaaS的模式,這是一種全新的商業模式;
2. 后來以CRM 為突破口,建立了一個完整的以客戶為中心的,售前(營銷)、售中(銷售、履約)、售后(客服)全鏈路的軟件服務,可以看出他的產品就是圍繞商業模式展開,戰略就是圍繞客戶開展的一系列工作流程。
3. 到現在云計算, 促使他產生了幾朵云,營銷云, 銷售云,客服云,而大數據又促使ta產生了 分析云,AI 又產生了AI 客戶之類的服務;
7.4 行為差異
投入期,創新能力最重要,這時要考慮打造專利護城河;
成長期,銷售最重要,持續打造規模效應護城河;
成熟期,利潤最重要,持續打造網絡效應和品牌護城河;
衰退期,成本最重要,用遷移成本減緩產品的衰退。
有一陣子,內心浮躁,無所事事。領導說有機會就跟著市場、營銷、工程的同事去接觸接觸業務,如果可行,以后轉型也方便。后面就跟著事業部的業務同學去拜訪客戶,到用戶現場參觀,了解產品是如何在用戶公司使用的,到一線聽他們的吐槽(大部分是罵聲)。人間清醒是客戶,付了錢,產品哪里好用、哪里有問題,意見反饋、客服電話打了一通又一通,這些都是從結構化的數據里面看不出來的。
有種說法是說客服才是一家公司最懂業務的人,只要他們想,隨時可以去挑戰任何一個產品、技術和業務!
在B端用戶分析里面,很多時候通過數據分析在異常上找不到的原因,在用戶現場指不定就茅塞頓開了。為什么這個用戶原來很活躍,一個時間點之后,它就不活躍了,因為它的業務主體發生變更了,老板原來的確是做這個細分板塊業務的,有一天他朋友來合伙投資,整體業務方向就變了;為什么這個用戶的營業額突然就下降了,因為他們家老板又開了家子公司,還是同一撥人,當地有小企業扶持政策,還可以免一部分稅;……這些部分都離不開對細分行業的了解,隨著業務知識的增加,會更合理的看待數據,以及對數據中對異常做解釋。
鑒于對產品、業務、用戶有了更深層次的理解,再回過頭來看數據,認知面就會不太一樣。
十、認識用戶,了解用戶,切勿閉門造車
熟悉業務最好的方式,是直接去找用戶進行面對面的對話,高效而簡潔;
其次是角色代入式的按照用戶視角去模擬用戶在產品上的操作,熟悉產品模塊和流程;
最次是通過數據庫的表結構關系、DDL,去做業務假象,通過日常需求對接,豐富業務上的知識樹。
了解C端的用戶可以通過區域化的抽樣問卷調查,或者通過采買第三方平臺所提供的畫像數據,能夠用樣本分析的方法去對人群標簽做特征擬合。但是在B端,問卷調查的方式往往是行不通的,畢竟不同性質的企業,在群體特性的差異上是極大的。用戶走訪,是一個在B端不得不去做的事情,選擇一群合適的訪談對象,去和用戶做共創、做MPV、做試點,然后把研究的結果在更大范圍內進行復制、應用,避免閉門造車。
對應上面的四張圖,我周邊很多朋友在畢業沒多久就如第一個圖的呈現,起點高,偶爾有起伏,站的總歸一直在高處。回看我自己的職業生涯,覺得應該比較貼切右邊最后一張,職場進階的道路上雖然曲曲折折,但是總會在一個小周期之后能得到突破。
九、入門難,深造更難,不要沉迷于工具帶來的爽感
不得不說,初入職場的前幾年,特別沉迷于數據本身而不是業務,以及對各種數據處理技巧的深層次研究,用VBA、R、SPSS、Python不同的軟件去自研各種自動化的小工具,小有成就。
工具畢竟只是工具,就跟打游戲開荒一樣,當每個模塊、功能都嘗試用過一遍之后,就喪失了興趣,數據分析不過如此,幾年之后就索然無味了,分析無用。當對一件事情失去了興趣和焦點,整個人就會變得很浮躁,傲慢、漫不經心、焦躁、憂慮……以及沖動,我想辭職!
慶幸的是,碰到了一些比好的領導,都是人生中的引路人,在狀態極其不好的時候,給予方向上的指導,給了很多選擇。
前面已經提到過,對于企業用戶,其看重的是“生意”,功能訴求為主,普遍有豐富的生意經驗和復雜的業務流程,因此調研不僅要了解用戶使用網上產品的訴求、意見,更需要還原用戶原生行為(即線下做生意的行為,鏈路等)、訴求,據此對應投射到互聯網產品。
因為B端的業務決策鏈路長,且參與角色多,所以不同的人所掌握的信息和權力都有非常大的區別,即使是同一個崗位,不同級別、不同業務分工,所負責內容,關注點的不同。比如在市場營銷部門里面,總經理、總監、經理、主管,四個角色在同一事情上的視角和焦點都會不一樣;而在零售類型的企業,負責電商、線下渠道、直播渠道為了一個決策所需要的信息也會大不相同。
十一、寫在最后
過往面試的時候,面試官問最有成就感的事情是什么,我的回答“通過數據分析、挖掘去促成了2億市場規模的合同達成(專項項目組)”;“面向B端公司進行定制化的數據報告實現5000萬左右的數據營收(報告營收)”……我覺得這是比較感覺到自豪的。
回過頭看這些年的經歷,感慨萬千,在過去這十年的工作經驗里面,一直都是在數據分析這個title上。很想把這些年積累的一些知識內容以文字的形式記錄下來,對于一個純理科生來說,這無疑是一種挑戰。后面應該會拆成很多個部分,縫縫補補,陸陸續續的完善。
“人們就是把數據上傳了,我也不知道為什么。他們‘信任我’,一群傻 X(dumb fucks)。”
2022,「算法」屬于人民
本文轉自品玩 ,作者郭海惟
鏈接://mp.weixin.qq.com/s/nhzJZ_NKGN-y81UV4ndbXg
2004年,一位名叫扎克的大學生,正在創立一家名叫Facebook的社交網站。而“海量”的信息正讓這位24歲的大二學生有點手足無措。這4000個信息中,或許就有隔壁班女孩的地址,有校園明星的照片和SNS。而這段隱喻了社交帝國命運的經典對話,后來被《紐約客》的記者寫進了臉書的長篇報道里。
18年以后,小扎克電腦里的4000個私人信息,快速變成了在全球無數個服務器中存儲的接近40億用戶數據。后者支撐著這個社交帝國,每年進賬超過860億美元(折人民幣5481億人民幣)的廣告收入。
顯然,扎克伯格再也無法像看4000個信息一樣,望穿40億賬戶的信息。取而代之幫助他“穿透”信息的工具,叫做“算法”。不止是社交網站,在全球各地,無論是搜索、購物,還是新聞、短視頻,哪里有海量的數據,哪里就有算法。
長期以來,“算法”一直是巨頭們最好的助手。他幫助互聯網巨頭去理解用戶,延長用戶在自己內容社區中的使用時間,并形成海量且精準的商業投放決策。
這或許是互聯網的先賢們始料未及的:我們原以為自己只是為平臺讓渡了注意力和時間,但沒想到被一同出賣的還有自己的信息畫像。而我們即便是知道了自己的信息被出賣的事實,也不太了解這些信息究竟是如何被平臺利用的。
某種意義上來講,正是那4000個無償為扎克伯格上傳各類私人信息的“傻X”,幫助扎克伯格們開啟了未來十幾年金錢不眠的每一個晚上。
我們確實是扎克伯格口中的傻 X。可悲的是,我們也沒得選。
一邊是巨大的利益鏈條,一邊是缺少知情權和否決權的用戶。算法以及算法背后的數據規范,已經成為了全球數據監管部門的關注重點。而在新年的第一個工作日,我國的算法管理規范站上了一個新的臺階。
2022年1月3日,我國的《互聯網信息服務算法推薦管理規定》正式發布,后者將在3月1日起正式執行。這也標志著,在征求意見稿發布數月之后,我國第一個專門針對算法推薦的規章制度正式落地。
從實際內容上來看,征求意見稿與正式稿件略有不同。在規定方面,正式版規定有增加包括老年人權益在內的更多細節內容,并提高了對應條例的罰款標準。
一邊是巨大的利益鏈條,一邊是缺少知情權和否決權的用戶。算法以及算法背后的數據規范,已經成為了全球數據監管部門的關注重點。而在新年的第一個工作日,我國的算法管理規范站上了一個新的臺階。
2022年1月3日,我國的《互聯網信息服務算法推薦管理規定》正式發布,后者將在3月1日起正式執行。這也標志著,在征求意見稿發布數月之后,我國第一個專門針對算法推薦的規章制度正式落地。
從實際內容上來看,征求意見稿與正式稿件略有不同。在規定方面,正式版規定有增加包括老年人權益在內的更多細節內容,并提高了對應條例的罰款標準。
“算法中立”、“算法無罪”將變為歷史
以往在無罪推定原則下,算法提供者在具體場景中往往存在“權責不清”等問題。算法進而很輕易地成為了一個虛無的權力代名詞——無論是B端的流量分發、外賣派單;還是C端的內容閱讀體驗、動態價格體系,算法都擁有一切“說不清、道不明的”負面結果的“最高解釋權”。
但算法的機制,對于普通用戶來說往往是一個“玄學”,用黑箱來解釋黑箱,很多事情只能不了了之。當然,相比于算法帶來的模糊權責空間,算法背后“確定性”的商業收益卻都回歸到了平臺手中。
《規定》明確提出,算法提供者需要向使用者打開算法背后的黑箱:
“應當以顯著方式告知用戶其提供算法推薦服務的情況,并以適當方式公示算法推薦服務的基本原理、目的意圖和主要運行機制等。”“(鼓勵)優化檢索、排序、選擇、推送、展示等規則的透明度和可解釋性。”
而在算法的目的和使用程序上,《規定》也有明確的指導意見。
對于算法的目的,除了不能違反現有國家法律規定以外,算法同樣不能用來進行“不正當競爭”、“誘導用戶沉迷”、“過度消費”等目的,并且要“堅持主流價值導向”,“積極傳播正能量”。
在節點過程中,《規定》則提出“應當加強算法推薦服務版面頁面生態管理,建立完善人工干預和用戶自主選擇機制”,“不得將違法和不良信息關鍵詞記入用戶興趣點或者作為用戶標簽并據以推送信息。”
這等于是對原先“算法無罪”、“技術中立”所帶來潛在衍生后果的一個警示。
算法在實際的互聯網實踐中是有傾向和價值觀的,而算法的所有者需要對算法衍生出來的價值觀和內容負擔責任。
用戶將擁有更細顆粒度的算法權力
一方面,《規定》賦予了用戶“拒絕算法”的權力。
《規定》要求算法提供者應當“向用戶提供不針對其個人特征的選項”,或者“提供便捷的關閉算法推薦服務的選項”。而用戶一旦執行關閉,“算法推薦服務提供者應當立即停止提供相關服務。”
另一方面,《規定》還賦予了用戶“改良算法”的權力。
《規定》要求,“算法推薦服務提供者應當向用戶提供選擇或者刪除用于算法推薦服務的針對其個人特征的用戶標簽的功能。”作為用戶,我們也可以更了解系統賦予我們的“標簽”,并且有針對性地進行刪除選擇。
* 手機淘寶上線的個性化廣告標簽管理
此外,《規定》還要求算法推薦服務提供者賦予用戶更加方便形式監督權力,“設置便捷有效的用戶申訴和公眾投訴、舉報入口,明確處理流程和反饋時限,及時受理、處理并反饋處理結果。”
而除了以上對算法方向上的行為規范外,《規定》也“點名”鼓勵了部分“算法策略”在平臺生態建設的積極作用。
如,“鼓勵算法推薦服務提供者綜合運用內容去重、打散干預等策略,并優化檢索、排序、選擇、推送、展示等規則的透明度和可解釋性,避免對用戶產生不良影響,預防和減少爭議糾紛。”
其中也是內容去重、打散干預等,與平臺長期以來扶持腰部生態、鼓勵原創作者等策略長期一致,有助于整體算法平臺生態的發展。
而藏在一切規范背后的問題是,誰才應該是算法的主人?
算法看上去是程序員的代碼。但好的算法之所以能成立,更多來源于用戶的數據和行為反饋——沒有數據,就沒有算法。從某種程度上而言,算法背后的基石是機器對每一個用戶及其行為的“理解”。在理解的基礎上,再做出對于未來行為概率學上的預判。
在過去,這種解釋權和收益權都是屬于大公司的。大公司如何“理解”我與我的決策,在過去對于我本人來說是一個“黑箱”。以至于大部分用戶從來沒有想過,如果有一天自己可以駕馭算法是一種什么樣的體驗?
最簡單的權力行使方式是,我可以拒絕算法提供者通過濫用自己的信息獲利。
而更深層次的影響或許是,未來我很快就可以看到自己在各個平臺中的畫像——原來B站認為我喜歡鬼畜、抖音認為我愛圍觀社會熱點……
而如果未來平臺真的可以讓規則機制變得透明、可以把算法權力讓渡給用戶,進而讓用戶可以決策自己的內容偏好。那么,我是否可以值得一個我更喜歡的、脫離了簡單低級趣味的算法內容產品?
這或許還沒有那么快能實現,但至少有一點是確定的:
以2022年為起點,算法這個“神器”,應該屬于人民。
彩蛋
那些為共同目標勞動因而使自己變得更加高尚的人,歷史承認他們是偉人;那些為最大多數人們帶來幸福的人,經驗贊揚他們為最幸福的人。
History recognizes those who work for a common purpose and thus become more noble?Great men; those who bring happiness to the greatest number of people, experience praises them as the happiest.
聯系電話:15801365057
投稿方式:kai.zhao@yeepay.com