Benford Analizi

Benford Analizi
Benford Analizi

Son Sürümde Yapılan

Yeni versiyon yayımlandı.

Yönetici Notu

Bu sihirbaz, Benford analizi konusunda tarihi ve teorik bilgiler verir. Kendisine aktarılan veri setlerini Benford analizine tabi tutarak sonuçlarını gösterir.

Genel Bilgi

Analitik inceleme prosedürleri arasında sayılan "Benford Analizi" duruma göre denetim ve vergi incelemelerinde de kullanılmaktadır.

Benford Kanununa göre rakamların kullanım sıklıklarının doğal bir dağılımı vardır. Bu analiz, verilerdeki rakam dağılımlarının Benford Kanununa uygun olup olmadığını bir başka ifade ile sayıların manipüle edilip edilmediğine bakmak için yapılır. Bu analizin temel noktası insanların rastgele davranamayacağına dayanmaktadır. İnsanlar bir hileye olanak vermek amacıyla sayı türettiklerinde alışkanlıklarının neticesi olarak belirli birkaç numarayı tekrar ederler, bir başka ifade ile sayı doğal dağılıma uygun üretilmemiş olur.

Kısa tarihçe

Benford Kanunu hakkında bilinen ilk makale Simon Newcomb tarafından (astronom ve matematikçi) 1881 yılında American Journal of Mathematics’de yayımlanmıştır. Newcomb hesap makinelerinin olmadığı dönemlerde, logaritmik cetvellerde ilk sayfaların diğer sayfalara göre daha fazla yıprandığını fark etmiştir ve araştırmalarını buna göre şekillendirmiştir. Araştırmaları neticesinde, küçük rakamların büyük rakamlara göre daha sık kullanıldığı sonucuna varmıştır. Bunun neticesinde 1 rakamı 2 rakamına göre daha çok, 2 rakamı ise 3 rakamına göre daha çok kullanılmaktadır. Newcomb bu araştırmasını formülize etmiştir: Olasılık=Log10((rakam+1) / rakam)

Mark J. Nigrini’nin, 200 bin civarında mükellefin vergi beyanlarına ilişkin verileri kullanarak hazırladığı “Vergi Kayıp ve Kaçaklarının Benford Yasası ile Analizi” başlıklı doktora tezi, kamu gelir-harcama profili analizinde Benford Yasasının kullanılmasında temel çalışma olmuştur.

Bu sihirbaz ile Benford Kuralı hakkında teorik bilgiler edinebilirsiniz. İsterseniz programa tanıtacağınız veri setleri üzerinde aşağıdaki Benford analizi uygulamalarını yapabilirsiniz:

Testler

a) Birinci basamak testi: Benford’un sayısal analiz testlerinden en genel ve en temel testtir. Bir ön test niteliğinde olup bu testten elde edilen sonuçlar, verilerin Benford Kanunu’na uygun dağılıp dağılmadığını tespit etmede kullanılmaktadır. Alt ve üst sınırlar belirlenerek, bu sınırların dışında kalan verilerin Benford Kanunu’na uygun bir dağılım göstermediği söylenebilir. Veriler arasında ilk basamaktaki rakamların tekrarlanma sıklıklarını göstermektedir.
b) İkinci basamak testi: İkinci basamak testi de birinci basamak testinin olduğu gibi genel ve temel bir testtir. Bu test kullanılarak yapılacak olan işlem de, alt ve üst sınırlar dahilinde verilerin Benford Kanunu’na uygun dağılıp dağılmadığını tespit etmektir. Veriler arasında ikinci basamaktaki rakamların tekrarlanma sıklıklarını göstermektedir.

c) İlk iki basamak testi: İlk iki basamak testi, birinci ve ikinci basamak testinin devamı niteliğindedir. Ancak önceki testlere göre daha özel ve veriler üzerinde daha ayrıntılı durmaktadır. Bu test sayıların ilk iki basamağındaki rakamların tekrarlanma sıklıklarını tespit etmektedir. Böylece ilk basamakta ve ikinci basamakta var olabilecek sapmalar birinci ve ikinci basamak testinde görülemeyecek olsa bile bu iki sapma ilk iki basamak testinde görülebilecektir.

d) İlk üç basamak testi: İlk üç basamak testi, ilk iki basamak testine göre daha özel ve kapsamlı bir testtir. Bu test veri kümelerindeki sayıların ilk üç basamağındaki rakamların sıklıklarını göstermektedir. Diğer testlerde olduğu gibi bu testte de beklenen değerler ile gözlemlenen değerler arasındaki fark hesaplanır. Ancak bu testin kullanılabilmesi için veri sayısının 10.000’in üzerinde olması gerekmektedir. Bu testin esas özelliği, analiz sonuçlarına göre ortaya çıkan anormallikler üzerine yoğunlaşmasıdır.

e) İlk dört basamak testi,

f) Mükerrer sayılar testi: Bu test frekansı yüksek olan, başka bir deyişle en fazla tekrarlanan sayıları tespit etmede kullanılır. Bu testin amacı; kuşkulu olabilecek sayıların yerini belirlemektir. Aşırı sayı tekrarı durumunda, tekrarlanan sayılar ilk iki ve ilk üç basamak testlerinin sonuçları ile karşılaştırılarak sapma veren sayılar bulunabilecek ve denetim hedefi belirlenmiş olacaktır. Bu sebeple mükerrer sayılar testi ile ilk iki ve ilk üç basamak testlerinin birlikte değerlendirilmesi gerekmektedir.
Test için Rakam Frekans Faktörü (NFF) kullanılır. NFF sıfır veya sıfıra yakın olması verilerde çift kayıt sorunu olduğunu gösterirken; 1’e yaklaşması veri setinde çift kayıt probleminin bulunmadığını gösterir.
Ek olarak “aynı, aynı, farklı” ve “aynı, aynı, aynı” testlerinde kullanılan ödemelerin anormalliklerinin tanımlanmasına yardımcı olur.

g) Yuvarlama testi: Bu test satıcıların tanımlanmasında, tahmini gereksiz miktarlardaki faturalar ve ödemelerde kullanılır. Yuvarlanan rakamlar testi; 5, 10, 25, 50, 100 ve 1000`in katları olan sayıların hesaplanmasında kullanılır. Yuvarlama ve son iki basamak testleri, hile veya hatalı sayılardan daha ziyade, tahmin edilmiş ya da türetilmiş sayıların ortaya çıkarılmasında kullanılmaktadır.


Yuvarlama Hatası Kontrolü, Nispi Büyüklük Faktörü Testi (RSFT) ile yapılmaktadır. Veri setindeki yuvarlama hatalarını bulmaya yönelik bu testte veri setindeki en büyük rakam ikinci büyük rakama oranlanarak normal aralıklara uymayan rakamlar tespit edilmeye çalışılmaktadır.
RSFT fazla sıfır veya haneleri yanlış ayrılmış rakamların tespitinde önemli rol oynamaktadır. Ondalık küsur hanesi iki rakamlı olarak kayıt yapılıyorsa RSFT>100 oranı ondalık ayıracının yanlış olduğunu test etmekte kullanılır.

h) Son iki basamak testi: Son iki rakamın dağılımının incelenmesi rakam yuvarlamalarının incelenmesine ek bir prosedür olarak düşünülebilir. Teorik olarak bütün son iki rakam sayıları, 0,01’lik bir beklenen değere sahiptir. Benford Kanunu’na göre rakamların rastlanma olasılıkları sayıların son hanelerine gittikçe birbirine yaklaştığından her bir 00-99 arası her bir rakam ikilisinin olasılığı 0,01 olarak alınabilir.
Son iki basamak testinin amacı, aslında küsuratlı olan ancak yuvarlanmış ve oynanmış sayıları tespit etmektir. 10.000 adetin altında olan veri setlerinde kullanıldığında daha etkin sonuçlar vermektedir.

Benford Kanununun faydalı olmadığı durumlar

Kuralın, suni olarak oluşturulmuş (tahsis edilmiş) çek ya da fatura numaralarında veya tamamen rastlantısal meydana gelmiş loto sonuçlarında uygulamasında mümkün değildir.

Veri seti maksimum ve minimum değerlerden oluşmamalıdır. Örneğin, bir günün 24 saat olması nedeniyle günlük çalışma saatleri 0 ile 24 arasında sınırlı bir değer alacağı için uygun değildir.

Veri seti belirlenmiş sayılardan oluşmamalıdır. Örneğin, sosyal güvenlik numaraları, Banka hesap numaraları, T.C Kimlik numaraları, vergi kimlik numaraları bunlardan bazılarıdır. Bu numaralar birbirini takip eden numaralardır ve bu numaraların ilk rakamları ve son rakamları bir şeyi ifade etmez.

Bir ürünün satış fiyatının insanları psikolojik olarak etkilemek amacıyla 100 yerine 99,99 lira gibi küsuratlı belirlenmesi de kuralın faydalı olmasını engeller.

Çıktılar

Gerek teorik bilgiler ve gerekse veri setiniz üzerinde yaptığınız çalışmalar sırasında üretilen;
a) Izgara (data grid) verileri üzerine sağ tıklayarak Excel`e ihraç edebilir,
b) Grafikler üzerine sağ tıklayarak bu grafikleri kopyalayabilir veya farklı resim formatlarında kaydedebilirsiniz.

Bu program Atc Tools programının ayrılmaz bir parçasıdır. Atc Tools programını tetkik veya indirme için burayı tıklayınız.