Vardinių numerių tikimybė tarp automobilių markių

Šioje naujienoje pateikta informacija publikuota Valstybės duomenų analitikos Facebook paskyroje:
https://www.facebook.com/ValstybesDuomenuAnalitika/posts/pfbid02DVTqdUeu21cSLNX1JxyrfLWAr4bXTnJXdtHGfGZGQQGtJt3PZPk1a7YdBEMT3YJbl

Antrojoje serijos dalyje tyrėme, kaip Lietuvoje riedančių lengvųjų automobilių vardiniai numeriai (tie, kainuojantys 1500 eurų) yra pasiskirstę tarp automobilių markių. Vardinių numerių pavyzdžiai: "DAR1US", "0K", "W1NNER", "JUST0", "NELI69", "KAUNA5", "J0KER", "JESU5", "RRRRRR", "V0DKA". Sudarėme automobilių markių top 30-uką.

Top pozicija | Markė | Kiek-iš-kiek | Bayes tikimybė
1: LAMBORGHINI 6 / 11 (53%)
2: ROLLS-ROYCE 7 / 16 (44%)
3: MC LAREN 2 / 3 (59%)
4: MORGAN 1 / 2 (49%)
5: BENTLEY 12 / 80 (16%)
6: FERRARI 3 / 18 (20%)
7: PORSCHE 88 / 2132 (4%)
8: MASERATI 7 / 108 (7%)
9: CAN-AM 1 / 4 (33%)
10: ASTON MARTIN 2 / 20 (14%)
11: QUATTRO 1 / 8 (20%)
12: JAGUAR 15 / 1771 (1%)
13: LAND ROVER 24 / 3780 (0.7%)
14: HUMMER 2 / 81 (3.6%)
15: MERCEDES BENZ 162 / 44653 (0.4%)
16: LINCOLN 2 / 126 (2.3%)
17: BMW 269 / 98728 (0.3%)
18: CUPRA 2 / 144 (2.1%)
19: DODGE 6 / 1266 (0.6%)
20: CADILLAC 2 / 255 (1.2%)
21: LEXUS 18 / 9521 (0.2%)
22: JEEP 9 / 4370 (0.2%)
23: GAZ 2 / 332 (0.9%)
24: MINI 6 / 2946 (0.2%)
25: CHEVROLET 5 / 2841 (0.2%)
26: AUDI 87 / 152739 (0.06%)
27: CHRYSLER 4 / 3083 (0.16%)
28: FORD 20 / 42786 (0.05%)
29: SMART 2 / 1143 (0.26%)
30: PONTIAC 1 / 216 (0.92%)

Jūs tikriausiai pastebėjote, kad pateiktas markių rikiavimas yra ne visai įprastas akiai. Pavyzdžiui, kodėl ROLLS-ROYCE yra aukštesnėje pozicijoje už MC LAREN? Juk vardinius numerius turi tik 7 iš 16 RR ir net 2 iš 3 McL automobiliai. Taip yra todėl, kad top sąrašą rikiuojame pagal pasikliautinojo intervalo apatinį rėžį, kad atsižvelgtumėm į statistinį neapibrėžtumą, kylantį iš nedidelio duomenų kiekio.

METODIKA
Tirti tik fiziniams asmenims priklausantys lengvieji M1 klasės (sedanai, hečbekai, universalai, kupe, kabrioletai, daugiatiksliai) benzinu ar dyzelinu (kaip pagrindiniu kuru) varomi automobiliai, kurių sėdimų vietų skaičius 2-6, nuosava masė iki 3.5 t., variklio tūris nuo 500 iki 8000 cm3. Pašalinti specialieji automobiliai (gyvenamieji, šarvuoti, autokatafalkai, greitosios pagalbos, gaisrinės etc.). Taip pat pašalinti specialiuosius valstybinius numerius turintys automobiliai (diplomatiniai, tranzitiniai, istoriniai etc.). Iš viso tirta 1156930 automobilių. Tarp jų rasti 906 vardiniai numeriai (0.08%). Pasikliautiniams intervalams nustatyti naudotas Bayeso metodas su Beta skirstinio formos parametrais 1.0 ir 1.1. Tikimybių rikiavimui naudojamas metodas, kuris vertina apatinę pasikliautinojo intervalo ribą, o ne pačią tikimybę (tokiu būdu atsižvelgiama į neapibrėžtumą, kylantį iš nedidelio duomenų kiekio).

------
Šis turinys yra skelbiamas su "CC BY-NC-ND 2.0" Creative Commons licencija. Tai reiškia, kad 1) jį galima kopijuoti ir juo dalintis bet kur ir bet kokiu formatu, tačiau 2) būtina nurodyti tikslų šaltinį (nuorodą į šį postą) bei licenciją, 3) negalima naudoti komerciniais tikslais (pvz., paywalled turinys skirtas tik prenumeratoriams), 4) turinio (iliustracijų, teksto) negalima keisti, iškraipyti, redaguoti, negavus korektūros patvirtinimo iš šios paskyros administratorių.