使用活頁簿和 Benford 法則來測試會計資料 

 

會計系統是財務舞弊(Financial frauds) 最常見的標的。原因呢,引用銀行搶匪Willie Sutton 的名言,” 錢都在那邊”。

舞弊者最常使用的犯案手法就是創建一個虛假的交易分錄,例如偽造一筆雇用記錄或供應商付款,然後根據自己的利益操作這筆虛假交易。密謀成功與否,端看是否能夠把這筆交易隱藏於合法交易之中,藉此逃過管理階層和審計人員的法眼。

有趣的是,多數的人並不擅長創造” 自然資料”,使得優秀的審計人員可以運用一些簡單的統計工具去發現異常狀況。其中一種測試方法就是去看資料是否符合Benford 法則。

Benford 法則在探討自然產生數字的第一位數字的分布狀況。所謂自然產生的數字,例如供應商的付款、客戶的發票,和其他企業日常營運中發生的財務交易。舉例來說,供應商付款 $123.45的首位數字是1。供應商發票 $4,231.55的首位數字是4,以此類推。

與 一 般 人 的 認 知 相 反 , Frank Benford 發現首位數字並非呈現一個平均分配的狀況。相反的,數字1 是最容易發生的,接著是2 和3,以此類推。根據Benford法則,人員可以計算首位數字1、2….發生的次數,然後檢 視它們的次數分配。第一位數值越小其出現的頻率就越大,而數值越大者出現的機率就越小,則此分配符合 Benford’s 分配,為” 自然” 分配。如非,則數值有人工製造的嫌疑。

部分專業會計期刊已刊登了一些介紹Benford 法則的文章(如文末建議)。但大部分的文章多偏重理論,或要求使用者去下載其它的軟體去進行統計測試。對EXCEL 的使用者來說,這是非必要的額外花費。本文解說如何運用簡易的Excel公式來運用Benford 法則進行測試

運用 Benford 法則去測試首位數字

舉公司舞弊最容易發生的地方─供應商發票之測試為例。雖然每張發票含有大量的資料量,本例僅針對採購金額做分析。目標是要運用Benford 法則去瞭解這些交易是否為”自然”。圖1中列出測試的步驟,將於下列小節逐步說明:

步驟 1:選擇樣本
首先取得樣本資料並把他們存放到 Excel 活頁簿中。觀察的資料越多越好,最好使用一整年的資料。但如果測試項目數字很多,較小的樣本亦可。不過,基於統計推論之需,資料筆數最好超過100。(圖1 僅為範例, 只顯示少於100筆之資料)

步驟 2: 取出首位數字
如前述,Benford 法則是要檢視首位數字的分配。實際資料的位數(如 $10, $100 or $1,000) 並不重要。在活頁簿中,我們可以使用EXCEL 的 LEFT 公式來擷取首位數字。公式的格式如下:

=LEFT(“資料項目”, “字元數”)

公式中,“資料項目”指的是資料所在的欄位,而“字元數”指的是要擷取的數目(從文字或數字的最左邊數過來)。舉例來說,如果”字元數”是2,則EXCEL 會把欄位中的資料從左邊數過來的兩個位數擷取出來, 如果”字元數”是3則 會擷取三個位數。在此我們僅需取出一個字元,故欄位C3的公式應該是:

=LEFT(C3, 1)

因為C3的數值是“432.65,”所以跑出來的結果是”4”。錢字符號($)沒有顯示因為它是格式符號,Excel 公式運算時會把它掠過。在Excel 中針對第一個欄位將公式設好,可以複製到其它欄 位。圖一顯示了這個結果。

步驟 3: 建立次數分配
接下來要建立首列數字的次數分配。首先建立 圖1 右方表格的表頭,而數字“1,” “ 2,” … , “9”要被放在第一欄,就在”Digit”欄名的下方 。

現在我們可以看到,針對這九個數字,有多少發票金額是以此為開頭(0被忽略了,因為以0 開頭的數字可以被縮短再被其它數字取代)。雖然可以用EXCEL 的計數公式來處理,不過使用 COUNTIF 公式更簡單。此公式是用來計算某一資料區間內符合特定數值的發生次數。公式的格式如下:

=COUNTIF(資料範圍, 條件)

公式中,“資料範圍”指的是預定衡量的資料集合,而“條件”參數是文字或數值所在的欄位。舉例來說,公式COUNTIF(Z1:Z100, “Smith”) 會把資料範圍Z1:Z100中含有”Smith ”這個名字的欄位數目傳回來;公式COUNTIF(Z1:Z100, X3) 則會將資料範圍Z1:Z100中,數值等於欄位X3內數值的欄位數目傳回來。根據案例,我們想要了解測試數值中,每個九個數字的首位數字出現幾次 因此,在欄位H4─”Actual”欄名底下的第一個欄位,設下列的公式:

=COUNTIF($D$3:$D$32, G4)

一旦建立好COUNTIF公式,可以複製到表單中的其他欄位。圖1說明了這個結果。以本範例,首位字元是數值1 的狀況出現了四次,首位字元是數值2出現了三次,以此類推。

步驟 4: 計算期望分配
首位數字可能呈現甚麼樣的分佈? Benford’s 法則預測,約有30.1% 的機率首位數字會是1 ; 17.6%的機率首位數字是2,其餘依此類推。圖1 J 欄中,列出了所有首位數字的百分比。Nigrini曾撰文詳細解說此統計分配的演算法(詳見建議閱讀 Suggested Reading)。

從圖1中J欄列示的百分比,我們可以從樣本數 30來進行推估。每個首位數字,期望數字是百分比乘以樣本數。舉例來說,首位數字是1的情形,期望數字應該是30.1% 乘以樣本數30,即 9.03。因為H14欄位放的是所有的樣本數,因此I 欄的第一個的欄位(I4)的公式就是:

=J4*$H$14

公式中,欄位J4 內容是百分比(如第一個項目的 30.1%)而欄位H14 是整個樣本數─本例中的30。如果公式設定為欄位H4的絕對位置(如$H$4),則公式可以直接複製到I欄到其他欄位。如結果顯示,首位數字為2的期望數字是5.28,首位數字為 3的狀況是3.75,其他以此類推。當然,實務上是沒有辦法看到剛剛好有9.03張發票的首位數字是 1,或5.28張發票的首位數字是2。此處的計算是用來告訴我們,以一個概略的,平均值的角度,如果使用不同的樣本,重複這樣的實驗可能會得出甚麼樣的結果。

步驟 5: 繪製結果
現在有兩列數值─首位數字的實際分配,以及由Benford法則理論推論出來的期望分配。我們想要了解的就是它們是否一致。

一個解決方案是去把兩個資料繪製成圖表來進行觀察。可以使用Excel 的繪圖工具,以直方圖的方式呈現(詳見圖一)。期望數值表達的是根據 Benford 法則推出出來的狀態─首位字元為 1 期望值最高,接著首位數字2,以此類推。實際數值則顯示了目前樣本中的首位數字的實際分配。

繪圖工作有兩種作用。首先,針對樣本中發生的實際資料和期望資料是否一致的問題,圖表提供了一目了然的答案。以本例來看,答案是”不大符合”。我們可以看到,首位數字1發生的機率大概只有預測的二分之一,而首位數字4發生的狀況遠高於預測。

其次,圖表可以顯示資料異常狀況─如本例中 的首位數字4。當然資料異常不表示一定是有舞弊問題,但是數字確實是一種警訊。如果本例中的發票是公司採購,則首位數字4 的異常資料可能特別需要高度重視,如果每位採購人員有特定的採購金額上限。曾有審計人員於查核中發現,採購部門主管開了很多張金額剛好稍少於$5,000 的支票,原因是為了迴避公司採購金額超過 $5,000就要進行招標程序的規定。

步驟 6: 執行獨立性檢定
雖然樣本和期望值不一致,另一個尚待釐清的問題是─”有多麼不一致”。審計員可以使用Excel 的獨立性檢定(CHTEST)公式─卡方檢定─來獲得協助。獨立性檢定又被稱為”配適度”(goodness-of- fit)檢定。亦即,此統計檢定在測量樣本的實際分配和假定分配狀態的一致程度。以我們的樣本為例,就是要去了解圖一中樣本實際分配狀態的H 欄和Benford 法則的I欄的一致程度。Excel 獨立性檢定的公式內容:

=CHITEST(實際值的範圍, 預測值的範圍).

公式中”實際值的範圍”代表的是樣本的數值,” 預測值的範圍”代表是理論分配。檢定所需的數值就在H欄和I 欄中。因此,欄位J15中所含的獨立性檢定的公式,就是

=CHITEST(H4:H12,I4:I12)

步驟 7:形成結論;資料是”自然的”嗎?
執行完Excel 獨立性檢定,我們可以發現樣本實際數與Benford 法則的符合程度。93%的數值表示實際分配與理論分配之間有很高的一致性,而數值很小,如3%,表示兩個分配非常的不一致。如果把圖1 的資料鍵入另一個活頁簿,且變換發票的數字,則實際數值的直方圖會開始接近預測值,而獨立性檢定傳回的數值也會上升。

如圖一的欄位J15所示,獨立性檢定的結果是 7.89%─非常小的數值。這樣的數值表示是公司 有舞弊狀況? 不一定。不過,一般而言,低於5% 的數值表示表示實際分配符合預測分配(Benford) 的機率非常低;而數值10%或以下,表示至少有 90%的機率,資料可能是不正常的。

所以結論呢?獨立性檢定結果數值很低,表示樣本資料可能是人工假造的。在作出這樣的結論之前,還有另一個作法:使用新的資料進行重複測試。這是使用Spreadsheet 模型的優點:只要在 B欄和C欄重新置換資料,則Excel 會重新計算出圖一中的結果。 那如果再次執行檢定的結果數值依舊是很低?那這樣其中的意義就很值得玩味,因為結果其實要用倍數來檢視。如果兩次樣本測試下,卡方檢定的結果都是10%,則原始資料是” 自然”的機率會變成(0.1 * 0.1 =0.01)。這樣結果對審計員來是一個重大的訊號,表示極需要進一步的追蹤和問題成因的調查。

Benford 法則的適用情境

首位數字的自然分配狀況是不平均,這個概念似乎違反一般人的直覺。畢竟,如果我們在一個完美的紡紗車上繪上1到9數字,則每個數字出現的機率應該是一樣的。但是自然產生的財務交易資料不能和轉輪的資料相提並論,因為他們資料的長度是不受限的。可以用這個方式來思考,當銀行帳戶增加,從數百美金變成數千美金,哪個首位數字會最先出現在新的餘額?答案是”1” (一千元)會先出現,然後是”2”(二千元),接著是3(三千元),以此類推。因此,每一次數值會依序增加,數字1先出現,然後是2和3,Benford 解釋的就是這個狀況,這就是為什麼Benford 分配中首位數字1,2,3 的發生機率合起來就占了整個分配的 60%以上,而非一般人想像的30% (詳見圖1的J 欄中的數字)。

上述狀況也說明了使用Benford 法則時的一些限制。首先,本法則只適用於自然發生的資料,採購金額、付款金額、股價、應付資料,存貨價格、客戶退貨都是類似的範例。而足球賽、湖泊分佈、城鎮人口─Benford 在他的研究中使用的 範例,也是一樣的狀況,只是這些資料通常不會是財會專業人員的興趣。人工給定的號碼,如電話號碼、彩券號碼、客戶或支票的編號,原本資料就被定義為單一且不能重複,亦不適用於 Benford 法則。

其次,要避免使用非自然狀況產生的財務資料。舉例來說,折扣店的購買金額可能不會符合 Benford 分析,因為每一個項目經常只會列有一種價格。同樣的,有上限的數值,像是每班飛機的所載的乘客數,或企業員工每年的工作天數,並無法運用到這種分析方式。

第三,當擷取分析資料時,很重要的是抽樣要平均。舉例來說,如果抽樣的發票金額在美金 $100~$999之間,則Benford 法則會失效,因為分析的資料被限縮在一個固定範圍。對於小型公司而言,因為原本的交易量就較少,使用一整個月完整的資料或針對每個月的資料進行抽樣,可能會是較佳的做法。

第四,Frank Benford 的研究不僅限於自然交易發生數字的首位數字,他也提出了第二位位元數字的機率分配。這個法則也可以被運用來作分析,類似本文案例所示,只要把Excel 改成使用 Mid 公式功能,把將測試的字元取出來,即可進行類似的分析。

最後,從技術的角度,資料量必須要夠大才能產生有用的統計分析結果。卡方分配的原則是,期望數字的筆數至少要有5筆。因為Benford 分配的最小比例是4.6%,回推以後實際值(樣本數)至少應該有100筆資料。(本文範例使用的筆數較少,只是方便讀者瀏覽所有的測試資料)。

結論

Benford 法則是一個強大的工具,可以協助審計人員去檢視,查核的財務資料到底有多”自然”。使用Excel 的公式來做運算,不僅步驟直觀容易執行,且無需額外購置其他的軟體。但審計人員也必須瞭解,並非所有的財務資料都適合做 類似的測試。在進行分析時應該要考慮到這些限制。

推薦讀物

  • Benford, Frank; “The Law of Anomalous Numbers,” Proceedings of the American Philosophy Society, vol. 78, 1938, p. 551-572
  • Browne, Malcolm W.; “Following Benford’s Law, or Looking Out for No. 1,” New York Times, 4 August 1998
  • Cleary, Richard; Jay C. Thibodeau; “Applying Digital Analysis to Benford’s Law to Detect Fraud: The Dangers of Type I Errors,” Auditing, vol. 24, no. 1, May 2005, p. 77-81
  • Hill, T.P.; “The First-Digit Phenomenon,” American Scientist, vol. 86, no. 4, July-August 1998, p. 358-364
  • Johnson, Peter; “Fraud Detection with Benford’s Law,” Accountancy Ireland, vol. 37, no. 4, August 2005, p. 16-17
  • Nigrini, Mark; “I’ve Got Your Number,” Journal of Accountancy, vol. 187, no. 5, May 1999, p. 79-83
  • Rodriguez, Ricardo; “Reducing False Alarms in the Detection of Human Influence on Data,” Journal of Accounting, Auditing, and Finance, vol. 19, no. 2, 2004, p. 141-159
  • Rose, Anna M.; Jacob M. Rose; “Turn Excel Into a Financial Sleuth,” Journal of Accountancy, vol. 176, no. 2, August 2003, p. 58-60
  • Stone, Amey; “Using Software to Sniff Out Fraud,” Business Week Online, 30 September 2003, p. N
  • Williamson, Duncan; “Vital Statistics,” Accountancy,vol. 133, no. 1327, March 2004, p. 108-110

作者: Mark G. Simkin, Ph.D.
is a professor of information systems at the University of Nevada (USA). He can be reached at markgsimkin@yahoo.com.

譯者:謝蕙萱 , 勤業眾信聯合會計師事務所資料風險管理顧問