Bin
亦稱為
分箱
分組
什麼是箱 (bin)?
箱 (bin) 是單一範圍的連續值,用於在圖表中分組數值。分箱資料有助於簡化資料視覺化,以便人們可以了解其資料的分佈並輕鬆找出異常值。您最常在直方圖中看到箱,但它們並非直方圖獨有,並且在其他視覺化(如折線圖或圓餅圖)中也很有用。
如果您的資料集中度量包含許多唯一值,則在圖表上繪製每個個別資料點可能會看起來雜亂無章,並且可能不是資料的最佳表示方式。當您對資料進行分箱時,這些值會被分組為大小相等的間隔(例如 1–10、11–20、21–30 等等),而您產生的圖表將顯示每個箱中值的計數。
資料分箱範例
圖 1 顯示 Metabase 的範例資料庫中產品的價格,以直方圖顯示。

此處的箱是價格範圍;我們可以看見 $37.50–50.00 價格範圍內的產品多於任何其他範圍。
Metabase 自動對這些值進行分箱,但我們也可以選擇我們想要的箱數(10、50 或 100 個),以進一步調整此圖表。如果您的箱大小太小,您會得到太多箱,並可能最終得到難以解釋的視覺化。但是,箱數太少會讓您對資料的分佈產生不完整或過於壓縮的印象,因此請多方嘗試,找出最適合您資料的方式。