數據科學專案管理的困難
身為資深數據科學家,我工作的重要一部分是為順利的專案規劃和執行建立流程和環境。專案管理是一項重要的任務。我們嘗試了不同的專案管理框架,但結果仍然不盡如人意。
直到我們研究了數據科學團隊和專案的獨特需求,我們才意識到大多數「已建立」的專案管理框架都用於製造、開發等領域,在這些領域我們可以假設任務具有合理的可見性。
然而,這種假設通常不適用於數據科學專案,這使得這些框架不適合我們面臨的問題。
那麼,數據科學專案管理有哪些獨特的特徵呢?
我會說高 CUA 因素(即Complexity(複雜性)、Uncertainty(不確定性)和 Ambiguity(模糊性))是關鍵特徵。
主要後果是專案規劃效果不佳,因為我們沒有良好的目標設定和時間估算參考,在某些情況下,我們甚至不知道解決方案是否真的存在(考慮到約束條件)。
因此,數據科學專案(尤其是研究專案)依賴於提問、調查、回饋和迭代。這並不自然地符合「規劃-執行」範式。相反,專案控制的關鍵在於「決策」。從規劃到決策的重點轉移使團隊能夠對其發現做出反應,這對於研究專案至關重要。
應用數據科學專案管理框架
在改進決策的想法中,我們最喜歡的是 Heath 和 Heath (2013) 提出的 WRAP 模型。 WRAP 代表 Widen Your Options(擴大您的選擇)、Reality-Test Your Assumptions(現實檢驗您的假設)、Attain Distance Before Deciding(在決策前保持距離)和 Prepare to Be Wrong(準備好犯錯)。
我們實際上根據 WRAP 作為指導原則創建了一個檢查清單,然後在每個檢查點,我們都會執行該檢查清單來做出決策,例如繼續原始想法、更改假設/範圍/方法等,或者如果我們發現繼續不是最佳決策,則將其擱置或停止專案。
有了完善的決策流程,即使沒有嚴格的專案規劃作為控制,各個利害關係人也確信團隊正在處理最佳可能的任務,並且通常比制定導致無處可去的專案計畫更滿意。