จับทุจริตด้วย Benford’s law
ถ้าจะให้เล่าเรื่องคณิตศาสตร์ที่ประทับใจมากที่สุด หนึ่งในนั้นก็ต้องเป็นเรื่อง Benford’s law ครับ ซึ่งตอนแรกที่ได้ยินเรื่องนี้ ผมก็ไม่ค่อยอยากเชื่อเท่าไหร่ครับ (มันเหลือเชื่อจริงๆ)
ก่อนอื่นเรามาเล่นเกมส์กันสักหน่อยไหมครับ…
ให้ทายครับว่าจากประมาณการตัวเลข GDP ปี 2016 ของแต่ละประเทศทั่วโลกตามวิกิพีเดีย จะมี GDP ที่ขึ้นต้นด้วยเลข 1 กี่เปอร์เซ็นต์? (เช่น ประเทศจีนมีค่าประมาณการ 11.4 ล้านล้านดอลล่าร์สหรัฐ ขึ้นต้นด้วยเลข 1)
เป็นไงครับ ทายกันว่าเท่าไหร่บ้างครับ?
สำหรับคนที่ทายว่า 11% ผมขอเดาว่าคุณกำลังคิดว่าเลขแต่ละตัว (1 ถึง 9) น่าจะมีโอกาสเท่าๆกัน ที่จะเป็นเลขตัวแรก
ทีนี้ตาผมบ้าง ผมจะขอใช้ Benford’s law ทายว่าจะมีเลข 1 เป็นเลขขึ้นต้นประมาณ 30% ล่ะกันครับ มาดูกันว่าจะแม่นหรือเปล่า
ซึ่งผมก็ได้ไปทำการนับข้อมูลด้านบน แล้วมาสรุปตามรูปด้านล่างครับ
เซอร์ไพรส์? Benford’s law แม่นอย่างกับตาเห็น! ซึ่ง Benford ได้บอกไว้ว่าโอกาสที่เลข 1 ถึง 9 จะเป็นเลขขึ้นต้นคือ 30.1% 17.6% 12.5% 9.7% 7.9% 6.7% 5.8% 5.1% 4.6% ตามลำดับครับ
จะเห็นได้ว่าเลขแต่ละตัวมีโอกาสแตกต่างกันอย่างมากที่จะเป็นเลขตัวแรก โดยเลข 1 มีโอกาสมากกว่าเลข 9 อยู่ถึง 6 เท่าตัว!
แหม… ถึงตอนนี้คาดว่าต้องมีคนที่คิดว่าฟลุ๊ครึเปล่า? ถ้าเปลี่ยนหน่วยจากดอลล่าร์เป็นบาทล่ะ? เลขทั้งหมดก็จะเปลี่ยนไปหลังจากคูณด้วย 35 บาทต่อดอลล่าร์ใช่ไหมครับ
ผมก็เลยลองเปลี่ยน GDP ให้อยู่ในหน่วยบาทแล้วลองนับดูใหม่ตามรูปด้านล่าง
เซอร์ไพรส์ครั้งที่สอง! การกระจายตัวยังเป็นไปตาม Benford’s law ทีเด็ดของ Benford’s law อยู่ตรงนี้ครับ… คุณสมบัติไม่ขึ้นกับหน่วยวัด (Scale Invariance)
เชื่อว่าตอนนี้ทุกคนคงประทับใจและทึ่ง กับ Benford’s law เหมือนกับผมแล้วล่ะครับ
แน่นอนครับ Benford’s law ก็ไม่ได้ใช้ได้กับตัวเลขทุกชนิดหรอกครับ ส่วนใหญ่จะใช้ได้กับเลขที่ไม่ได้เรียงกัน ที่มีช่วงกว้างครอบคลุมตัวเลขหลายหลัก เช่นจากหลักสิบถึงหลักล้าน เช่น จำนวนประชากร ขนาดแม่น้ำ หรือ ราคาสินค้า (ซึ่งทั้งหมดนี้คุณ Benford ได้ทดสอบมาแล้ว)
ตัวอย่างเลขที่ใช้ไม่ได้ก็เช่น ล็อตเตอรี่ เพราะเป็นเลขเรียงกัน ทำให้แต่ละเลขมีโอกาสเท่ากันที่จะเป็นเลขตัวแรก หรือ ส่วนสูง เพราะมีช่วงแคบมาก (คนมากกว่า 99% คงสูง 1 เมตรกว่าๆ ใช่ไหมล่ะครับ)
ส่วนการจะเอา Benford’s law ไปใช้ในการจับทุจริตอย่างไรน่ะหรือครับ? เราก็จะเอาหลักการนี้ ไปทดสอบข้อมูลธุรกรรมต่างๆ เช่น ข้อมูลจัดซื้อ หรือ ข้อมูลค่าใช้จ่าย ครับ
ถ้าเกิดข้อมูลที่เราวิเคราะห์เบี่ยงเบนจาก Benford’s law มากๆ เราก็อาจสงสัยได้ว่ามี ธุรกรรมแอบแฝง ซึ่งเราก็ควรทำการวิเคราะห์เพิ่มเติม เช่น ถ้ามีนโยบายกำหนดให้เบิกค่าใช้จ่ายโดยไม่ต้องอนุมัติได้ครั้งละไม่เกิน 1,000 บาท แล้วเราพบว่ามีค่าใช้จ่ายขึ้นต้นด้วยเลข 9 มากกว่า Benford’s law มากๆ ก็เป็นไปได้ว่าอาจมีการเบิกค่าใช้จ่ายปลอมขึ้น (คาดเดาว่าคนโกงส่วนใหญ่ไม่น่าจะรู้จัก Benford’s law เลยโกงได้ไม่เนียน)
ทั้งนี้ Benford’s law ยังสามารถใช้เป็นหลักฐานในศาลอเมริกาได้ด้วยนะเออ
ติดตามคณิตศาสตร์สนุกๆเรื่องอื่นๆ ได้ตามด้านล่างนะครับ