新創公司常犯的資料模型錯誤

資料塑模很困難。以下是一些在開發模型時應避免的錯誤。

在協助建立數家新創公司的分析堆疊後,人們開始看到一些模式。有時這些模式是令人愉快的:幾乎每個人都喜歡從完全不知道發生什麼事,到對上週發生的事有模糊概念的那一刻。其他模式就沒那麼棒了,而且通常涉及圍繞資料模型綱要的決策。

重要的是要注意,我們將在下面討論的反模式是新創公司特有的。其中一些模式實際上對於後期公司來說是不錯的主意,但對於小型、產品市場契合前、資源受限的新創公司來說,這些是您不需要犯的錯誤。

廢話不多說,以下是早期分析中五大痛點來源

1. 以測試或假資料污染您的資料庫

無論是測試帳戶、員工帳戶、不同的資料程式,還是透過貓咪心電感應傳入的訂單,太多公司包含的資料都要求您在許多或大多數查詢中忽略某些事件或交易。

透過以測試資料污染您的資料庫,您已對公司所有分析(和內部工具建置)徵稅。您可以權衡此稅收與交易效率或開發人員生產力。有時這種稅收是值得的,有時則不是。對於大型公司而言,交易效率是一個非常重要的目標,您可以花費幾位工程師或分析師的時間來清理結果。

如果您規模較小,您可能無法負擔得起這個,而且您可能應該在其他地方做出權衡。

2. 事後重建工作階段

圍繞使用者行為、滿意度和價值的重要問題中,很大一部分圍繞著工作階段指標。無論它們被稱為「工作階段」、「對話」、「支援聯絡人」或其他名稱,這些指標都指的是與使用者相關的一些離散事件,這些事件應組合在一起並視為單一概念。然而,令人震驚的是,新創公司的資料模型通常無法在企業詞彙中捕捉到這個基本概念。

工作階段通常是事後(即事後)重建的,這通常會導致很多脆弱性和痛苦。構成工作階段的確切定義通常會隨著應用程式本身的變化而變化。此外,用戶端上的使用者工作階段或處理用戶端請求的伺服器通常有很多上下文。在您的應用程式中指派工作階段、支援票證或對話 ID,遠比事後嘗試重建工作階段容易得多。

3. 軟刪除

在大規模情況下,在高負載下刪除資料庫中的資料列是一件壞事。「軟刪除」是一種常見的綱要工具,可以減輕刪除的效能影響,以及後續的壓縮(或清理)。此外,「軟刪除」可以輕鬆取消刪除資料列以恢復已刪除的資料。

另一方面,「軟刪除」要求每個讀取查詢都排除已刪除的記錄。如果您只考慮應用程式資料呼叫,這似乎還不算太糟。但是,當乘以您將執行的所有分析查詢時,這種排除很快就會開始成為嚴重的阻力。此外,「軟刪除」又引入了一個不同的使用者可以做出不同假設的地方,這可能會導致您需要偵錯的不一致數字。

4. 誤用半結構化資料

半結構化資料(例如,編碼為 JSON 的欄位)在隨著時間推移存在多種不同結構的情況下可能很有用。隨著資料庫變得越來越大,半結構化資料也有助於避免在大量讀取或寫入負載下遷移大型表格的麻煩。

然而,當嘗試從資料庫中取出資料時,半結構化資料也可能導致很多問題。通常,半結構化資料的綱要僅透過慣例強制執行,可能會不可預測地更改,或因暫時性錯誤而關閉,並且通常需要大量的事後清理才能有用。

有時,半結構化資料欄位是藉口,讓您在編寫功能後才思考您需要的結構。在這種情況下,您實際上擁有結構化資料,只是它未強制執行、容易出現錯誤,並且通常很難使用。一個簡單的測試:如果 JSON 欄位的每個實例都具有相同的四個欄位,您可能應該分解該結構。

5. 「針對工作選擇正確的資料庫」症候群

公司技術堆疊中使用多個不同資料庫的存在通常表示以下三種情況之一

  • 一家真正龐大、複雜的公司,擁有各種各樣的需求和部門。
  • 一個高效能、頂尖的工程和營運團隊,致力於非常困難的問題,需要高度最佳化應用程式的所有方面。
  • (最常見的是)一個小型團隊,不斷在他們只略微了解的技術中撲滅大火。

每增加一個資料庫,您就會承擔大量的營運管理費用。此外,每個額外的資料庫都是另一組您需要放入分析資料庫的資料。這些資料庫將具有略有不同的語意、資料類型和您必須整理清楚的自然資料模型。

因此,請抵制使小型功能更易於實作的衝動,因為這會使整體營運和分析變得更加困難。

提示:讓取得業務指標變得容易

當思考您的資料模型是否符合您的分析和交易需求時,識別以下內容會很有幫助

  • 企業關心的 10 個重要指標
  • 應用程式中最常執行的 10 個更新查詢
  • 應用程式中最常見的 10 種讀取模式

您正在尋找一種資料模型,它可以最大限度地減少所有這些不同查詢的痛苦。一般來說,業務指標的查詢最重要,因此,如果為應用程式更新和讀取引入一些複雜性將使查詢業務指標更容易,那就去做吧。您將最大限度地提高整體生產力,因為應用程式端的繁重查詢通常比常見的分析或商業智慧問題少得多。

此外,應用程式的查詢通常在原始碼控制中完成、包裝在自動化測試中,並且通常更加強化。業務指標的查詢通常很分散、由許多人編寫,並且通常較少受到控制。因此,盡您所能讓您的企業更容易取得做出更好決策所需的指標。

接下來:新創公司常犯的十個分析錯誤

當您啟動分析時,您將會犯錯。以下是如何減少錯誤。

下一篇文章