Evleneceğiniz Kişiyi Seçmenin Matematiksel Yöntemi: %37 Kuralı
diyelim ki biz 20 yaşındayız ve 30 yaşına kadar çok zaman kaybetmeden evlenmek istiyoruz. yılda 10 kişiyle, yani her ay 5-6 kişiyle sevgili olursak 30 yaşına geldiğimizde toplamda 100 kişiyle sevgili olacağımızı biliyoruz. biz bu 100 sevgili içinden en iyisiyle evlenme derdindeyiz ancak bir sevgiliden ayrıldıktan sonra o sevgiliyle evlenme şansımız kalmadığı için bu potansiyel 100 kişi içerisinden en iyi sevgiliyi henüz o sevgiliden ayrılmamışken tespit etmemiz gerekiyor. çünkü mesela 100 sevgili içinden en iyisi 56. sevgiliydi ama biz bu durumu 100. sevgiliden ayrıldıktan sonra fark ettik. bu durumda "tüh ya en iyisi 56. sevgiliymiş keşke onunla sevgiliyken bunun farkına varsaydım" demek durumunda kalırız ama iş işten geçmiş olur. yani 56. sevgilinin en iyi sevgili olduğunu 56. sevgiliden ayrılmamışken anlamamız gerekiyor.
peki bunu nasıl yapabiliriz? %37 kuralı ne demek?
sevgili durumunun özelinde %37 kuralı basitçe ilk 37 sevgiliden ayrıldıktan sonra her sevgiliye bir puan vermek ve bu sevgililerin içlerinden en yüksek puanı alanı üst sınır olarak belirlemek demektir.
örneğin 1. sevgilimizden ayrılıp ona 10 üzerinden 8 puan veriyoruz, sonra 2. sevgilimizden ayrılıp ona 10 üzerinden 7.2 puan veriyoruz, sonra 3. sevgilimizden ayrılıp ona 8.1 puan veriyoruz ve bu şekilde 37. sevgiliden ayrılana dek devam ediyoruz. diyelim ki bu 37 sevgilinin içinden en yüksek puanı alan sevgilinin puanı 9.1 puan idi. bu durumda yapmamız gereken şey 9.1 puanı üst sınır olarak belirlemek ve yeni sevgililer bulmaya devam etmek.
diyelim ki 38. sevgilimiz 9.0 puan aldı. bu durumda ondan ayrılıp 39. sevgilimizin puanına bakarız. mesela 39. sevgilimiz de 8.8 puan aldı, bu durumda ondan da ayrılıp yeni sevgililer bulmaya devam ederiz.
ne zaman ki puanı 9.1 puandan yüksek olan bir sevgili bulduk, o zaman o sevgiliye nikahı basıp kaçırmamamız gerekiyor. yani mesela 54. sevgiliye kadar hiçbir sevgilinin puanı 9.1'den yüksek olmadı ama 54. sevgili 9.2 puan aldı. bu durumda yapmamız gereken şey 55. sevgiliyi ve bu sevgiliden sonra gelecek olan sevgilileri hiç düşünmeden 54. sevgiliye nikahı basmak ve onu elden kaçırmamak. çünkü 54. sevgiliden sonra puanı 9.1 üzerinde olacak bir sevgili bulma ihtimali matematiksel olarak bulamama ihtimalinden düşüktür ve en mantıklı tercih düşük olan ihtimale değil yüksek olan ihtimale oynamak, yani 54. sevgiliden sonra daha iyi bir sevgili bulamayacağımız varsayımıyla hareket edip 54. sevgiliye nikahı basmaktır.
şimdi hiçbirimizin 100 kişiyle sevgili olamayacağı gerçeğini kabullenerek yolumuza devam edelim ve yukarıdaki durumu gerçek hayatımızda kullanabileceğimiz bir ihtimale, yani mesela hayatımız boyunca toplamda 10 farklı kişiyle sevgili olabileceğimiz ihtimali üzerine düşünelim.
nasıl 100 kişiyle sevgili olduğumuzda 37. kişiden sonra gelecek daha iyi ilk kişi muhtemelen hayatımızda karşılaşabileceğimiz en iyi partner oluyorsa, 10 kişiyle sevgili olduğumuz durumda da 3,7 sevgiliden, yuvarlak hesap 4. sevgiliden sonra karşımıza çıkacak olan ilk daha iyi kişinin en iyi seçeneğimiz olma ihtimali çok yüksek oluyor. bu durumda eğer hayatımız boyunca gerçek anlamda 10 kişiyle ilişki yaşayabileceğimizi düşünüyorsak ve evlenmeye niyetimiz varsa 4. kişiden sonra karşımıza çıkan ve önceki 4 kişiden daha iyi anlaştığımız ilk kişiyle evlenmemiz gerekir.
eğer 10 kişiyle değil de 8 kişiyle sevgili olacağımızı düşünüyorsak da 8 kişinin %37'si olan 2,96. sevgiliden, yani aslında 3. sevgiliden sonra karşımıza çıkan ve ilk 3 sevgiliden daha iyi olan kişiyle evlenmemiz gerekiyor.
neden?
aslında bu hesap optimal seçim yapabilmek adına aday elemede durulması gereken noktayı hesaplayabilmek için tasarlanmış secretary problem yani sekreter probleminin, ya da diğer adıyla marriage problem, yani evlilik probleminin çözümü için geliştirilmiş bir algoritmanın sonucudur.
bu sekreter problemi senaryosuna göre sekreterlik pozisyonu için acil işe alım yapmak isteyen bir yöneticinin iş başvurusuna 100 sekreter başvuruyor ve yönetici her mülakatın sonunda o kişiye direkt olarak işe alındığını ya da işe alınmadığını söylüyor. yani mesela başvuranlardan biri geldi ve bizimle bir mülakat yaptı, biz o kişiye "biz sizi arayacağız" demiyoruz da "maalesef işe alınmadınız" diyoruz. böylelikle o kişiyi reddettiğimiz zaman geri dönüşümüz olmuyor ve önümüzdeki adaylara bakmak durumunda kalıyoruz.
bu senaryoda en uygun kişiyi bulabilmek için yöntem geliştirmeye çalıştığımızda aslında olasılıklar evrenine girmiş oluyoruz ve kullanacağımız tekniği olasılık dağılımları üzerinden oluşturmamız gerekiyor. bu iş kolay gibi görünse de aslında kolay bir iş değil ve hatta sırf bu işi yapmaya çalışmanın matematik dünyasında kendi ismi ve paragraflarca açıklama bulunan bir wiki sayfası var. bu araştırma konusunun ismi optimal stopping.
the theory of optimal stopping wiki sayfası
sekreter ve eş seçiminde durmamız gereken yeri kestirebilmek için birden fazla yolumuz olsa da en kısa yolumuz optimal stopping teorisi için geliştirilmiş olan odds algorithm isminde, benim türkçeye "ihtimal algoritması" olarak çevirdiğim algoritmayı kullanmak.
ihtimal algoritması basitçe yaşanabilecek olayların ihtimal dağılımını ve bizim en mantıklı seçimi yapabilmek için hangi noktadan sonra yaşanacak ilk işimize gelen olayda seçim yapmamız gerektiğini anlayabilmemiz için geliştirilmiş bir algoritma.
bu algoritma ileri düzey matematik bilgisi gerektirir ve burada kanıtını basitçe açıklamam mümkün değildir çünkü kanıtı şöyle başlayıp,
sayfalarca ilerledikten sonra şöyle biten bir şey:
ancak yine de bu kanıt için kullanılan algoritmanın neye benzediğini bir miktar açıklamaya çalışacağım ve yazının sonunda matematik okuması yapmak isteyenler için nedense ben hariç kimsenin türkçeye çevirmemiş veya açıklama girişiminde bulunmamış olduğu ingilizce kaynakları ekleyeceğim.
algoritma basitçe şu şekilde
n sayıda aday olduğunu ve her birini 1 ile 0 arasında bir değere göre puanlayacağımızı, başarılı adaya, yani seçmek istediğimiz adaya 1 değerini, diğer adaylara, yani seçmek istemediğimiz adaylara da 0 değerini vereceğimizi düşünüyoruz.
bu şekilde tüm adayları i1, i2, i3, i4... in şeklinde listeliyoruz. diyelim ki içlerinden en uygun aday k sırasındaki aday olsun. bu durumda k sırasındaki aday olan ik, 1 değerine sahip oluyor. ik dışındaki diğer tüm adaylar da 0 değerine sahip oluyor. yani mesela ik = i1 değilse bu durumda i1= 0 denklemine sahip oluyoruz.
bu noktada algoritmaya devam edebilmek için birkaç tanım yapmamız gerekecek.
bu tanımlar sırasıyla:
pk = p( ik = 1) = k numaralı adayın bizim istediğimiz aday olup olmaması konusundaki tahminimiz.
qk = 1 - pk = 1 sayısından pk ihtimalini çıkardığımızda bulacağımız sonuç.
rk = pk/qk = pk değeri ile qk değerinin birbirine oranı.
rk değerimiz k numaralı adayın gerçekten de bizim istediğimiz aday çıkma ihtimalini gösteriyor.
şimdi düşünelim.
pk değeri aslında bir tahminden ibaret çünkü bizim aslında 100 kişi içinden hangisini seçebileceğimizi bulabilmek adına algoritma geliştirme ihtiyacı duymamızın sebebi o kimin sekreterimiz ya da evleneceğimiz kişi olduğunu kesin olarak bilemememiz. bir kişinin evleneceğimiz kişi olduğunu kesin olarak anlayabilirsek bu kişinin evleneceğimiz kişi olma ihtimali 1, kesin olarak bu kişiyle evlenilmez dersek de o kişinin evleneceğimiz kişi olma ihtimali değeri 0 olur. kimsenin değeri 1 olamayacağından pk değeri 1'e eşit olamaz.
bu durumda da qk = 1-pk olduğundan qk değerinin 1-1 olamayacağını, yani qk değerinin 0'a eşit olamayacağını görürüz.
böylelikle rk = pk/qk oranımız qk değeri 0'a eşit olamayacağından tanımsız olmaz.
algoritmamız şu şekilde:
n tane adayımız var demiştik. yani mesela 100 adayımız varsa n sayılı aday 100. aday oluyor.
r değerlerini n numaralı adaydan, yani tersten başlayarak topluyoruz:
r100 + r99 + r 98...
genel formülümüz: r(n) + r(n-1) + r(n-2) ...
bu şekilde değerleri toplayarak ilerliyoruz ve toplamımız ne zaman 1 sayısına eşit ya da 1 sayısından büyük olursa duruyoruz. durduğumuz yere s noktası diyelim.
böylelikle toplamımız: r(n) + r(n-1) + r(n-2) ... + r(s)
eğer toplamımız 1 sayısına ulaşamazsa s noktasını 1 kabul ediyoruz, yani ilk adaya kadar ilerlediğimizi farz ediyoruz.
bu durumda yukarıda tanımladığımız q değerlerini çarpacağımız qs isminde yeni bir işlem tanımı yapıyoruz ve qs değerimiz şu şekilde oluyor:
qs = (q(n))(q(n-1))(q(n-2))...(q(s))
bu algoritmayı kullanarak the odds theorem ismindeki ihtimaller teoremini kanıtlayabiliyoruz ve bu teorem bize şunu söylüyor:
s noktası durmamız gereken noktadır ve qs ile rs değerlerinin çarpımı bize kaçlık bir yüzde değerinden sonra durma noktası seçmemiz gerektiğini söyler ve bu çarpım ne kadar az olursa bize zaman kazandırabilme açısından o kadar iyidir.
rs değerimizin 1 veya 1'den fazla olduğu durumlarda aşağıya linkini bırakacağım makaledeki kanıta göre qs ile rs değerlerinin çarpımının alabileceği en düşük değer 1/e sayısına, yani 0.36787944117 sayısına, yuvarlak hesap 0.37 sayısına götürür.
buradaki e sayısı bildiğimiz e sayısıdır.
kaynakça ve ileri okuma: sekreter problemi, ihtimal algoritması, 37 kuralından bahseden bir matematikçinin yazısı, ihtimal teoreminin kanıtının yapıldığı makale