簡單用數據做出好決策
會看到這本應該算時無心插柳,原因在於我當初在準備資料分析的簡報資料時,剛好引用到這本書的一些資料,當時就覺得這本書的觀念與我的雷同,所以因此就入手了。
這本書挺適合有做過一些分析的人來看,若你完全沒有分析的經驗也無妨,作者已經很貼心的告訴你對於初學者或是想一睽分析領域的人可以看哪幾章節,非常實用。

何謂有影響力的分析?
具影響力的分析 = 資料科學 +決策科學
- 資料科學,指的就是技術層面,旨在從資料中找出洞見
- 決策科學,指的則是商業層面,簡單的講就是透過你的分析資料可以去影響改變那些有權力的人,轉化成行動來執行
文中也提到一句話,讓我反思了很久實在不確定這句話到底是對還是錯「如果你發現利害關係人無法根據分析的發現而採取行動,那麼這項分析就不需要執行。」
就商業流程角度,這句話絕對是對的,資源要放在有用的地方,如此一來才可以達到最大的效益。但就一個資料分析者來說,一個好的分析卻因此這樣不能被執行,心裡的那種無奈會非常的深,因為可能只是利害關係人無法理解或是看不到而已。
不過,這個問題這樣講恐怕只會衍生更多的層面,這邊就先不談了…:)
數據分析 VS 大數據分析在台灣,多數企業還是中小企業為主,談大數據分析真的太遙遠,連個數據分析可能都看不到。作者提出了大多數的分析其實真的不用倚靠所謂的商業分析工具,反過頭來只要善用Excel工具應該就可以解決日常分析工具80%的問題了,這點也跟我的觀念不謀而合,我在很多公司看到很多的所謂的分析報表資料,雖然也是Excel文件檔案,但多數都是人工花很多時間所做出來的,這些人完全不擅長Excel工具,不知道善用工具之後可以大幅度簡化他們的時間,甚至可以讓這些資料自動化來呈現。那大數據呢?我想這邊得先搞懂何謂大數據分析,學術上我們會簡稱大數據分析可以用3V來解釋,分別是數量(Volume)、多樣(Variety)以及速度(Velocity),但大數據包含了所謂的結構化資料跟非結構化資料,若少了其中一樣,嚴格說起來也不能叫大數據分析了。何謂結構化資料?簡單來說就是以欄跟列儲存的資料 (打開Excel檔案你應該就知道是什麼樣式了)而非結構式資料呢?通常意旨圖片、文件、影片等資料看到這邊我想大家心裡應該有底了吧,要做到所謂的大數據資料分析,應該不是每個產業、公司都可以做到的吧,不是技術問題、不是預算問題,而是在於你的資料真的有到所謂的非結構性資料嗎?另外,大數據資料的資料量要大到多少才叫做大數據也是一個問題,現在硬碟的儲存空間已經非常的大了,存個幾十T百T我想都不是問問題了,若你的數據資料能直接這樣被存到硬碟裡,我想也不要在談你是大數據資料了。
商業智慧做一份商業資料分析,多數時候真的Excel就可以完美解決了,前提是你要有一份完整且乾淨的資料,好方便你存取跟執行分析。(還是要在提一下,善用Excel的工具可以有效幫助你做所謂的清資料動作)另外,多數分析人員會犯一個很常見的錯就是他們會利用系統報表來作來源資料的分析 (或是拿分析工具直接去抓取系統的資料庫),這會影響什麼呢?
- 線上資料庫的執行效能
- 資料來源不是最佳化因為這樣,很多人就會懷疑分析工具是否有問題,殊不知要做這種所謂的商業分析,前提還是應該要做一份資料倉儲,以利整個系統的快速分析。
當然,要做到資料倉儲這個事情,必須要有一定規模的企業跟資訊部門才有辦法的,我想絕大部分還先好基本工跟觀念吧。
BADIR作者提出了一個作法,是可以讓資料順利走到決策的流程,一份資料若沒有辦法實際執行,那就沒有繼續分析的必要,而這個部分又可以區分資料科學(技術層面)跟決策科學(商業層面)。BADIR指的是商業問題、分析計畫、資料收集、洞見與建議,這五種方法確實幫助我們釐清問題,不過內容有點複雜,我覺得需要反覆思考執行才可以找出適合自己的方式。
結論這真的是一本給資料分析人員跟想一睽資料分析人的好書,內容沒有太艱澀的用詞、沒有講一堆理論公式、沒有談什麼特定工具,它讓我釐清了很多觀念跟用詞,對於未來我在做資料分析或是表達分析意念時有更多的幫助與說明。推薦指數:4顆星