В една обикновена изборна година мисля, че повечето хора са запознати с идеята за процента от избирателните райони, които изпращат данните си.
Тази година проблемът с този метод е, че поради големия обем ранно гласуване и гласуване по пощата, много често тези гласове не се броят по същия начин, по който се брои присъствения вот.
Присъствените гласове може да се броят от местния избирателен район. Но гласовете подадени от разстояние и ранния вот може да се броят от централизиран борд за град или окръг.
Това значи, че няма да имаме информацията, с която бихме разполагали в една нормална година.
Правя прогнози за обема гласове, които можем да очакваме във всеки щат, окръг и избирателен район.
Не само за президент, но и губернатор, Сенат и член на Камарата на представителите.
Освен това ще опитам да съставя модел и на евентуалните неизвестни.
В света на учените по данни съществува схващането, че прекарваме много време в работа с всякакви сложни алгоритми.
А в повечето време, ние търсим правилните източници на данни.
Двата най-големи източника са исторически данни от гласуване, които съм извадил за всяка президентска надпревара до 1976-та и борбата за място в Сената и долната Камара за същия период.
Вторият основен източник са данни от американското бюро за преброяване на населението.
Там има данни и за демографските групи. Разглеждам връзките между образователни нива, възраст, доходи или дали човек живее в градски район, предградие или селски район.
Всички тези фактори могат да ни помогнат да предвидим избирателната активност през тази година.
Освен това взимаме предвид колко оспорвана е една надпревара. При избора на президент искаме да знаем кои са спорните щати. Така че гледаме осреднени данни от допитвания.
В реалния живот това значи, че гласоподавателите може да чувстват, че гласът им е по-важен, а това са местата към които организаторите на кампанията насочват своите време и пари. Обикновено тези фактори водят до по-висока избирателна активност.
Мисля, че определено има риск някои хора да използват ранните гласове в своя полза.
Много е важно обществото да знае реалната ситуация по време на изборите, за да разбира по-добре резултатите от тях.