Chevron Left

查看所有社群故事

如何建立資料文件

2022年4月12日

Rick Radewagen

Snowboard Software

photo of Rick Radewagen

Rick Radewagen 是 Snowboard 的共同創辦人,這家公司協助團隊尋找、理解和信任他們的數據。在此之前,他在不同的組織中花費多年時間處理和分析數據。您可以在 LinkedIn 上找到 Rick。

文件化數據的目標是幫助使用者找到、理解並自信地使用數據。

但你不需要文件化所有內容。良好建模的數據通常是不言自明的。

「好的程式碼會自我文件化」這句話有相當的道理。你的目標應該是使用具表達力且一致的名稱,使其具有自我描述性。一個名為「dbo」的資料庫沒有幫助,「sales_prod」會更好,特別是當還有「sales_dev」和「finance_prod」資料庫時。

因此,文件化始於命名事物,但並不止於此。

使用資料庫系統的明確層級結構來建立由上而下的文件

a table with 5 steps to follow to document data correclty

這樣使用者將開始理解全貌,並能夠自行瀏覽您的數據環境。

文件化數據時應關注什麼

完整文件化前 3 個層級(系統、資料庫、結構描述)。專注於文件化最常用的前 10% 表格。建立一個流程,所有新表格/視圖/模型都應建立至少最基本的文件(在建立過程中,文件化最容易)。

通常只有對於數據產品或廣泛使用的報表表格,文件化所有欄位才值得。但對於這些,您應該嚴謹。如果一個欄位不值得文件化,它就不應該成為表格的一部分。

在實務上,選擇正確的詞語可能很困難。我應該使用客戶還是帳戶還是公司還是使用者還是網站?團隊中的每個人都理解我們使用的縮寫嗎?

為了應對這些挑戰,理想情況下,您的文件系統應支援您使用詞彙表,您可以在其中定義重要的術語一次,並在文件中參考它們。

提示

  • 使用具表達力且一致的名稱;
  • 由上而下文件化和文件化最常用的項目;
  • 通常一句話就足夠了;
  • 將文件化納入開發流程的一部分;
  • 在商業詞彙表中使用#定義;

Rick Radewagen

Snowboard Software

photo of Rick Radewagen

Rick Radewagen 是 Snowboard 的共同創辦人,這家公司協助團隊尋找、理解和信任他們的數據。在此之前,他在不同的組織中花費多年時間處理和分析數據。您可以在 LinkedIn 上找到 Rick。

你可能也喜歡

預測下一次點擊

Ukrit Wattanavaekin

Metabase

選擇樸實無華的數據技術

Jacob O’Bryant

Thesample.ai

數據目錄的努力:為什麼和如何

Juan Sebastián Suarez Valencia

Meisterlabs

你可能也喜歡

預測下一次點擊

Ukrit Wattanavaekin

Metabase

選擇樸實無華的數據技術

Jacob O’Bryant

Thesample.ai

數據目錄的努力:為什麼和如何

Juan Sebastián Suarez Valencia

Meisterlabs