Sturges Kuralı: Açıklama, Uygulamalar ve Örnekler

Sturges kuralı, bir dizi istatistiksel veriyi grafiksel olarak göstermek için gerekli olan sınıf veya aralık sayısını belirlemek için kullanılan bir kriterdir. Bu kural 1926'da Alman matematikçi Herbert Sturges tarafından ilan edildi.

Sturges, sınıf sayısını ve aralık genliğini bulmayı sağlayan örnek x sayısına göre basit bir yöntem önerdi. Sturges kuralı özellikle istatistik alanında, özellikle de frekans histogramlarını oluşturmak için yaygın olarak kullanılır.

açıklama

Sturges kuralı, bir örneği veya popülasyonu temsil eden bir veri kümesini sınıflandırmak için, sıklık histogramında bulunması gereken sınıf sayısını belirlemek için tanımlayıcı istatistiklerde yaygın olarak kullanılan ampirik bir yöntemdir.

Temel olarak, bu kural, sıklık histogramlarının grafik kaplarının genişliğini belirler.

Kuralını oluşturmak için Herbert Sturges, K aralığından oluşan ve burada belirli aralıklarla belirli sayıda örnek (i = 0, ... k - 1) bulunan, ideal bir frekans diyagramı olarak kabul edildi:

Bu örnek sayısı, kümenin bir alt kümesinin çıkarılabileceği yöntem sayısı ile verilir; yani binom katsayısı şöyle ifade edilir:

İfadeyi basitleştirmek için, logaritma özelliklerini denklemin her iki bölümüne de uyguladı:

Bu nedenle, Sturges, k ifadesinin optimal aralık sayısını belirttiği sonucuna varmıştır:

Ayrıca şu şekilde de ifade edilebilir:

Bu ifadede:

- k, sınıfların sayısıdır.

- N, numunedeki toplam gözlem sayısıdır.

- Log ortak taban 10 logaritmadır.

Örneğin, 142 çocuğun boyunun rastgele bir örneğini ifade eden bir frekans histogramı yapmak için, dağılımın sahip olacağı aralıkların veya sınıfların sayısı şöyledir:

k = 1 + 3, 322 * log 10 (N)

k = 1 + 3, 322 * log (142)

k = 1 + 3, 322 * 2, 1523

k = 8.14 ≈ 8

Böylece, dağılım 8 aralıkta olacaktır.

Aralık sayısı her zaman tamsayılarla gösterilmelidir. Değerin ondalık olduğu durumlarda, en yakın tam sayıya bir yaklaşım yapılmalıdır.

uygulamaları

Sturges kuralı, temel olarak istatistiklere uygulanır, çünkü sınıfların (k) sayısının hesaplanmasında ve her birinin uzunluğunun genliği olarak da bilinen bir frekans dağılımını gerçekleştirmesine izin verir.

Genlik, sınıfın sayısına bölünerek sınıfın üst ve alt sınırlarının farkıdır ve şöyle ifade edilir:

Bir frekans dağılımının yapılmasını sağlayan birçok ampirik kural vardır. Bununla birlikte, Sturges kuralı genellikle kullanılır, çünkü genellikle 5 ila 15 arasında değişen sınıf sayısına yaklaşır.

Bu şekilde, bir örneği veya popülasyonu yeterince temsil eden bir değer düşünün; yani yaklaşıklık, aşırı gruplaşmayı temsil etmiyor ve numunenin özetlenmesine izin vermeyen aşırı sayıda sınıfla da çalışmıyor.

örnek

Yerel bir spor salonunda egzersiz yapan erkek anketinde elde edilen yaşlara karşılık gelen, verilen verilere göre bir frekans histogramı yapmak gereklidir.

Aralıkları belirlemek için, numunenin büyüklüğünün veya gözlem sayısının ne olduğunu bilmeniz gerekir; Bu durumda, 30 var.

Sonra Sturges kuralı uygulanır:

k = 1 + 3, 322 * log 10 (N)

k = 1 + 3, 322 * log (30)

k = 1 + 3, 322 * 1, 4771

k = 5.90 ≈ 6 aralıklarla.

Aralık sayısından, bunların sahip olacağı genlik hesaplanabilir; yani, frekans çubuklarında gösterilen her bir çubuğun genişliği:

En düşük limit verinin en düşük değeri olarak kabul edilir ve üst limit en yüksek değerdir. Üst ve alt sınır arasındaki fark, değişkenin (R) aralığı veya yolu olarak adlandırılır.

Tablodan üst sınırın 46 ve alt sınırın 13 olduğunu; Bu şekilde, her sınıfın genliği şöyle olacaktır:

Aralıklar üst ve alt limitlerden oluşacaktır. Bu aralıkları belirlemek için alt sınırdan saymaya başlayın ve kural (6) tarafından belirlenen genliği aşağıdaki gibi ekleyin:

Daha sonra mutlak frekans, her bir aralığa karşılık gelen erkek sayısını belirlemek için hesaplanır; Bu durumda:

- Aralık 1: 13 - 18 = 9

- Aralık 2: 19 - 24 = 9

- Aralık 3: 25 - 30 = 5

- Aralık 4: 31 - 36 = 2

- Aralık 5: 37 - 42 = 2

- Aralık 6: 43 - 48 = 3

Her sınıfın mutlak frekansını eklerken, toplam örnek sayısına eşit olmalıdır; bu durumda, 30.

Daha sonra, her aralığın göreceli frekansı bu aralığın mutlak frekansını toplam gözlem sayısına bölerek hesaplanır:

- Aralık 1: fi = 9 ÷ 30 = 0, 30

- Aralık 2: fi = 9 ÷ 30 = 0, 30

- Aralık 3: fi = 5 ÷ 30 = 0.1666

- Aralık 4: fi = 2 ÷ 30 = 0, 0666

- Aralık 5: fi = 2 ÷ 30 = 0, 0666

- Aralık 4: fi = 3 ÷ 30 = 0.10

Daha sonra, aşağıdaki görüntülerde görüldüğü gibi, verileri ve ayrıca elde edilen aralıklarla ilişkili olarak bağıl frekanstan gelen diyagramı yansıtan bir tablo oluşturabilirsiniz:

Bu şekilde Sturges kuralı, tablo ve grafiklerin hazırlanması yoluyla bir veri örneğini özetlemek için bir örneğin bölünebileceği sınıfların veya aralıkların sayısını belirlemeye izin verir.