2021-10-9 資深UI設計者
編輯導語:數據分析有助于幫助我們獲知業務效果及其他效果反饋,然而當下企業在線下業務當中,不少數據都有所流失,這就要求企業尋找更有效的數據體系搭建方式。本篇文章里,作者就線下業務的數據體系搭建做了總結,不妨來看一下。
前言
在實際的業務環境下,能夠完全通過線上留存的數據搭建業務數據體系的情況主要還是以互聯網公司為主,有大量的線下傳統公司,是沒辦法通過線上數據的積累完成業務數據體系的搭建的,在這種情況就得通過不同類型的數據來源去獲取業務中可能涉及的數據,設計合理的業務數據體系,完成線下業務數據的監控、維護和分析。
如果是從數據邏輯出發,第一步應當是監控數據,就是我們平常一直說的看數據。
但在實際業務中,尤其是線下業務中,其實有大量業務沒有留存業務發生時點的數據,在業務的各個轉化節點的數據也很難及時獲取留存,大量的數據丟失。如果需要從監控數據開始,其實相對來說難度會很大,甚至有很多業務數據沒有合適的方式被留存下來,在日后的數據分析搭建中也無法起到作用。
所以,我更建議從業務的發展方向上入手,盡量細化業務流程,明確各個業務流程對部門業務到底有什么影響,核心業務流程是什么,優先從核心業務流程入手,根據業務流程的步驟完成業務數據的監控和留存。
舉個例子,如果對保險行業熟悉的朋友會知道,保險業所有公司都有“培訓”這個項目,甚至在保險業里面“組訓”、“督訓”都是很吃香的崗位,能夠在短期內積累大量經驗,往公司中高層走更快速,這個崗位主要的業務范疇就是“培訓”,培訓外勤、培訓新人、培訓合作渠道等等。
怎么評價培訓效果呢?依靠外勤人員的銷售量、銷售額對培訓效果進行評價,剩余對培訓效果的評價來自學員和更高級的培訓講師的打分。
其實可以從上述模式看出,對線下培訓這種業務模式的評判,對培訓崗工作人員能力、業績的評估其實很難通過以上評分模式進行量化,更不用說實際培訓效果的追蹤。
還是同個例子,如果要想追蹤實際培訓對銷售業務產生的效果和影響,要關注幾個模塊:
從培訓業務的目標出發,如果想從更細化的角度去關注培訓,會有以下幾個業務方會想要關注的點:
所有這些關注點的數據,均無法從線上獲取,也很難追蹤(這還是僅僅線下業務在實際業務細化關注項提出后的一部分數據的數據量化和追蹤,如果要實現業務數據的獲取,就需要公司嚴格要求外勤人員反饋該類型數據,可想而知如果是溝通渠道獲取業務數據,就會顯得更為困難)。
在這種情況下,線下業務數據體系建立就需要建立嚴格且標準的業務數據體系,這需要與每一步工作流程相互契合,這個流程有點類似于線上數據埋點的過程,只不過因為業務不在線上,沒法在線上完成數據積累。
當然,線下數據埋點和線上數據埋點完全不一樣,因為缺乏線上工具的記錄能力,大量數據記錄只能依靠人力完成,如果想要通過人力完成這類數據登記匯總,就需要使用統一的工具,使用統一的數據字段、數據格式,這需要做到數據流轉記錄的標準化留存。
以上問題的解決方法除了需要依靠人力對數據進行核準清洗外,建議最好是按照統一的字段建立本地數據庫。
熟悉EXCEL或者WPS EXCEL的朋友會了解,這兩個軟件的處理能力隨著數據量的上漲會十分受限,如果是行數超過百萬級的話,是無法在EXCEL中操作的,會出現數據丟失。
同樣的,如果數據量在20萬以上,使用IF系的函數將會加重性能負擔,非常容易崩潰,尤其是當出現過去的某一原始主鍵重復出現的時候,利用EXCEL技巧實現等價FOR循環會變得更難。
這個時候我們會更傾向于在本地建立MySQL數據庫,可以利用MySQLworkbench或者NAVICAT對本地數據庫進行處理, 利用本地數據庫的字典表的字段完成線下交互數據EXCEL/CSV表格表頭字段的統一,在簡單獲取了線下匯總回來的數據之后利用update函數完成數據更新,形成本地數據庫。
作為參考,這個是阿里天池某次比賽的測試集數據源,測試數據集的文件不超過100M,模型處理后的預測集也就100M-150M,這部分數據條數約為20W,如果是數據條數在70-80W左右的線下數據,文件大小會達到超過200M,如果還需要清洗、維護這些業務數據,僅僅依靠EXCEL是完全不現實的。
既然要建立數據庫,線下數據的維護同步時間就極為關鍵,線下數據的收集端口需要明確,不同部門、不同渠道之間進行數據交互的人員要固定,交互時間要固定,否則就容易出現數據交互不清晰,導致最后在不同的統計節點的數據無法統一,不斷會出現數據重復更新的情況,不利于數據檢測監控。
這要數據監控和數據維護以及數據統計在同個周期內完成,同時還要確定所有數據的每一次更新都是以數據覆蓋的邏輯,即每一次新增更新的數據范圍和內容必須是完全新增的數據。
舉個例子,新增的數據版本為C,數據庫內現有數據版本為B,更早的版本為C,上傳的時候就不允許C版本的數據中含有A版本的數據內容,這樣會導致數據的轉化順序存在混亂,涉及時間續流的數據就出現問題。
以上是線下數據體系中數據監控和數據維護的部分,接下來我們聊聊線下數據分析體系的搭建.
和線上數據類似,所有的線下“埋點”的數據回收都是服務于實際業務數據分析的,可以這么說,我們要的不是數據,而是數據告訴我們的事實,以及我們根據歷史事實能推導出的合理預測,從邏輯方法論上面,就是歸納—演繹。
想進行數據分析,首要的是需要對歷史和現階段的事實情況進行歸納統計,這就需要加入線下“埋點”的數據進行統計分析,即,先深入了解知道自己的情況。
深入了解自己的情況可以從以下幾個方向去深入思考:
了解了這些自身情況之后,還需要深入了解,那些和你在做一樣事情的人,在面對同類型業務核心指標的人,他們的工作情況、業務完成情況、實際業務流程轉化,和他們歷史的情況。
當然,所有的這些外部事實情況都可能不準確,這就需要從業人員實際判斷這些外部信息的準確性和可用性。
這些事實怎么得出?通過數據的形式。
這些事實怎么校驗?通過數據的形式。
舉個例子,還是以我們上說的保險公司培訓部門的例子。
假設當前保險公司的業務正常,市場正常,政策上國家沒有對保險市場提出什么更為嚴苛的政策要求,在這些條件下:
這些是相對比較概念化的事實,這時候就需要利用數據把所有的事實細化描述清晰,且所有的數據都需要和工作流程相關聯。
同時,所有的業務數據分析都需要建立“時間”的概念,我們可以畫一個時間軸來看這個業務流程:
每個業務流程下其實都需要一定時間完成當前工作狀態的信息收集,數據本身就具有時間的特性,如果是金融公司、金融部門,還會對數據的時間序列有更嚴格的要求,因此,數據本身就需要打上所屬時間的標簽。
在業務流程中,記錄每個事件發生時間點的數據,留存這些時間標簽下的數據,完成基礎數據源的匯總。
在分析中可以將分析劃分為幾層,可以先按“事前—事中—事后”的順序留存各個事件發生時點的數據,從中盡量明確有規律性的節點,例如:
這些時點的數據收集可以幫助你深入了解業務流程,在日后做到各類自動化有很大程度上的幫助,這就是業務體系初步建立之后再進行優化的工作了。
在關注了業務的核心指標后,找到能夠對核心指標產生影響的因素,將這些因素拆分成“事前—事中—事后”的形式,設定一定的主鍵完成數據特質化的積累。
以電商為例,電商可以以“訂單號—用戶ID”的形式,如果是在保險培訓的角度下可以參訓外勤人員ID作為主鍵,當然,不同的業務模式會有不同類型的主鍵,涉及的后續的一些數據內容也不一致。
還是以保險培訓為例,在培訓中有大量數據是沒有辦法輕松進行積累的,也同樣不能很明確地進行量化,這時候就要建立評分卡的制度,用于量化一部分難以直接估量的行為數據。
比方說,A講師培訓營銷技巧和保險學原理課程,兩門課程完全不屬于同一個課程體系下,在實際外勤作業中,營銷技巧所能給實際業績的增長是短期高效的,而保險學原理課程可能在提升外勤人員金融素養方面更為突出,可能在面對高凈值客戶的時候能更體現優勢。
這部分提升并不會很直接的在實際銷售業績上有明確的體現,這時候就會需要對實際的培訓效果進行分類歸納,建立不同評分評級制度。
類似于量化投資,這些數據都會需要和業務核心指標建模擬合判斷,根據歷史經驗,最好是建立相關的多元線性回歸模型,機器學習模型雖然在預測方面更具有優勢。
但是實際可解釋性并沒有那么強,在實際業務總結反饋的時候并不能明確的找出問題所在,所以在預測分析的角度還是更推薦從線性回歸的角度配合相關性進行分析。
希望分享的這些給現在還在線下摸索業務數據體系搭建的朋友們一些啟發。
藍藍設計建立了UI設計分享群,每天會分享國內外的一些優秀設計,如果有興趣的話,可以進入一起成長學習,請掃碼ben_lanlan,報下信息,會請您入群。歡迎您加入噢~~希望得到建議咨詢、商務合作,也請與我們聯系。
分享此文一切功德,皆悉回向給文章原作者及眾讀者.
免責聲明:藍藍設計尊重原作者,文章的版權歸原作者。如涉及版權問題,請及時與我們取得聯系,我們立即更正或刪除。
藍藍設計( m.paul-jarrel.com )是一家專注而深入的界面設計公司,為期望卓越的國內外企業提供卓越的UI界面設計、BS界面設計 、 cs界面設計 、 ipad界面設計 、 包裝設計 、 圖標定制 、 用戶體驗 、交互設計、 網站建設 、平面設計服務