Обяснено: Моделите за прогнозиране на изборите в САЩ и какво може да се е объркало през 2016 и 2020 г. - Декември 2022

Въпреки че гласовете все още се броят и данните все още се пресяват, американските анализатори започнаха да разсъждават върху цялата индустрия за прогнозиране на изборите, която прогнозираше много по-голяма победа за новоизбрания президент Джо Байдън от това, което видяхме миналата седмица.

На тази снимка от 7 ноември 2020 г. избраният вицепрезидент Камала Харис се държи за ръце с новоизбрания президент Джо Байдън, докато празнуват в Уилмингтън, Дел. (AP Photo/Andrew Harnik, File)

Почти ден след изборите в САЩ социологи и предизборни синоптици с готовност признаха, че техните модели и проучвания изглежда са се объркали за пореден път.





Въпреки че гласовете все още се броят и данните все още се пресяват, американските анализатори започнаха да разсъждават върху цялата индустрия за прогнозиране на изборите, която прогнозираше много по-голяма победа за новоизбрания президент Джо Байдън от това, което видяхме миналата седмица.

Как американските статистици създават своите модели за прогнозиране на избори?

Моделите съчетават два вида числа. Първите са основите - факторите, които формират избора на избирателите. Например как статутът на икономиката влияе на шансовете за заемане на длъжност или факта, че партия, която печели три пъти подред, се е случила само веднъж през последните 70 години.





Андрю Гелман и Мерлин Хайдеманс от Колумбийския университет, които създадоха модел за обобщаване на анкети за Economist, написаха: Както повечето прогнози, нашият модел... прилага миналите модели на поведение на гласоподавателите към новите обстоятелства... „Колко често предишните кандидати на подобни позиции са продължавали да спечелим?“ Ако тези исторически взаимоотношения се разпаднат, нашата прогноза ще се обърка.

След това изследователите разглеждат анкетите (отговори от представителни извадки). Моделът осреднява анкетите, претегля всяка от тях според размера на извадката и след това коригира за всякакви пристрастия. Нейт Силвър, фигурант в общността за прогнози на избори и редактор на утвърден източник на данни FiveThirtyEight, специално се отличава от социолог, заявявайки, че работата на неговата организация е да разбере колко погрешни могат да бъдат анкетите за създаване на вероятностни прогнози.



Крайният модел съчетава основите със средните стойности на анкетата. С тези два вида информация изследователите провеждат симулации голям брой пъти, за да открият колко пъти даден кандидат получава над 270 електорални гласа. В 1000 симулации, ако Байдън спечели 500 пъти, той има 50% шанс да спечели. С наближаването на изборния ден изследователите придават на анкетите по-голяма тежест пред фундаменталните.

Също така в Обяснено | Защо новоизбраният президент на САЩ Джо Байдън е малко вероятно да има значение за Кашмир



Какво се случи през 2016 г.?

Математическите оракули на американските избори с увереност предсказаха победата на Хилари Клинтън. Уважавани основни геодезисти дадоха преднина на Клинтън до четири точки. В крайна сметка тя води с 2,1 процентни пункта в народния вот. FiveThirtyEight се сблъска с горещината за прогнозата, че Хилари Клинтън има 70% шанс да спечели Белия дом. Силвър каза, че хората изваждат резултатите от изборните проучвания извън контекста.

The Economist написа: Невероятният триумф на г-н Тръмп през 2016 г. остави много количествени прогнози за избори да изглеждат глупави. Сам Уанг, професор в Принстън, обеща да изяде бъг, ако г-н Тръмп, за когото каза, че има само 1% шанс за победа през ноември 2016 г., се доближи дори до победа. (Той избра щурец.) Кликнете, за да следвате Express Explained в Telegram



Посмъртни изследвания от институции като Асоциацията за изследване на общественото мнение стигнаха до заключението, че анкетите са подценили теглата за избиратели без висше образование. Резултатът от New York Times установи, че липсата на тежести според образователния статус е погрешно изчислила подкрепата на Тръмп с четири точки, което съответства на грешката. В много отношения това беше просто подценяване на това колко избиратели са бели и нямат висше образование. При друга грешка късно взелите решения гласуваха за Тръмп повече от предвиденото и общата избирателна активност на Тръмп надхвърли очакванията.

Твърдяйки, че са поправили грешките, статистиците заявиха, че са си научили уроците от 2016 г.



Какво се случи през 2020 г.?

Няма съмнение, че анкетите са пропуснати (отново). Но няма да знаем с колко, докато не бъдат преброени всички гласове (включително оценките на отхвърлените бюлетини). След това ще направим преоценка. Но мисля, че е справедливо да се каже сега, че по толкова много начини, включително политически проучвания, Тръмп е sui generis, туитира директорът на анкетата в Монмут Патрик Мъри ден след изборите.

Проучванията показват, че Байдън води с най-малко осем процентни пункта в последния период от сезона на кампанията. Най-вероятно той ще завърши с победа от четири до пет процентни точки. Дори собствените частни анкети на двете кампании подцениха републиканските кандидати.



На държавно ниво прогнозите бяха още по-погрешни. RealClearPolitics и FiveThirtyEight са свръхпредсказани за Байдън във всеки суинг щат, с изключение на Аризона. По-специално Флорида беше далеч от целта; с почти четири точки Тръмп зае с три пункта състоянието, което социологическите проучвания средно предвиждаха за Байдън. 'Ню Йорк Таймс' и 'Вашингтон пост' водеха Байдън с 17 и 11 точки преднина в Уисконсин. Засега тя е с един процентен пункт разлика. Състезанията в Конгреса бяха още по-лоши, като демократите бяха заслепени от загубите си.

Анкети (особено на областно ниво) рядко ни подвеждаха повече и ще отнеме много време за разопаковането, туитира редакторът на Cook Political Report Дейв Васерман ден след изборите.

Прочетете също | Искате ли предварителен преглед на президента Байдън? Вижте пътеката на кампанията

Какво се обърка?

Твърде рано е да се каже, но теориите започнаха да проникват. Една теория на Зейнеп Туфекчи е, че няма достатъчно минали данни, за да се създадат точно основите, защото факторите в изборите се променят толкова съществено всеки път.

Други потенциални отговори може да се крият в окончателните данни за избирателната активност. Нейт Кон от New York Times казва, че или 2020 г. представи нов набор от проблеми, или проблемите от 2016 г. може никога да не са били отстранени. Той клони към първото, най-вече защото претеглянето на образованието не промени прогнозите. Проучванията установиха, че белите гласоподаватели без висше образование трябваше да гласуват за Байдън с по-високи проценти от Клинтън, но крайните резултати показаха, че те не са се променили според прогнозите. Друга грешка беше в изчисленията на висшите гласоподаватели, за които се предвиждаше да гласуват за Байдън с 23 точки повече от Тръмп. Но в действителност възрастните хора не гласуваха за Байдън с по-високи проценти.

Кон подчертава, че това не са неуспехи в оценката на размера на групите, а повече в техните нагласи. Това е свързано с твърдения на дясно на мълчаливо мнозинство, което гласува за Тръмп, но крие политическите си убеждения. След провалите през 2016 г. анкетите загубиха доверието си и може би по-малко привърженици на Тръмп бяха готови да отговорят на въпроси от анкетата.

Един очевиден потенциален ключ в числата беше пандемията. Анкети от преди удара на пандемията (между октомври 2019 г. и март 2020 г.) бяха по-точни, отколкото при наближаването на изборите. Една теория предполага, че демократите са били по-склонни да бъдат затворени през това време и е по-вероятно да отговарят на анкети, отколкото републиканците. Отговорите се увеличиха през това време и горещите точки започнаха да показват повече подкрепа за Байдън. С други думи, това не беше увеличена подкрепа за Байдън; това беше увеличение на вероятността привърженик на Байдън да отговори.

За съществени проблеми ли става въпрос или за представяне?

Някои политически експерти казват, че проблемът е в представянето на числата пред масовата аудитория, а не проблемът с числата. Например, ако Байдън получи 65 процента от победата на изборите, това означава, че той има почти един към три шанс да загуби. Въпреки това повечето гласоподаватели, които чуват шанс от 65 процента, си представят голяма вероятност.

Претендентите твърдят, че политическите оракули са създали толкова големи граници на грешки и предупреждения, че могат да кажат, че са били прави, независимо от резултата, което ги прави на практика безполезни. Силвър силно упрекна разказа, че социологическите проучвания са погрешни, като написа, че неговата организация правилно е предвидила, че Байдън може да преживее нормална или дори малко по-голяма грешка в гласуването и все пак да спечели. Гласоподавателите и медиите трябва да прекалибрират очакванията си около социологическите проучвания — не непременно защото нещо се е променило, а защото тези очаквания изискваха нереалистично ниво на прецизност — като същевременно се съпротивляват на желанието да „изхвърлят всички социологически проучвания“ ... Ако искате сигурност относно изборите. резултати, анкетите няма да ви дадат това - поне не през повечето време.

Как реагират институциите и хората?

Докато анализаторите предпочитат да представят аргументите си в оспорване един на друг, общото разсъждение в цялата област изглежда сравнително сплотено: намалете манията по анкетите.

Голяма част от американската демокрация зависи от това да можем да разберем какво мислят нашите съграждани. Това се превърна в по-предизвикателна задача, тъй като американците се подреждат в идеологически балони... Проучването на общественото мнение беше един от последните начини, по които трябваше да разберем какво всъщност вярват другите американци. Ако допитването не работи, тогава летим на сляпо, пише Дейвид Греъм от Atlantic.

Някои са проблематизирали цялата самата игра с числа, а не само теглата 2016 спрямо 2020. Среброто стана известно в прогнозирането на бейзболни игри, но за разлика от бейзбола... тази игра не винаги има предвидим набор от правила, които всички играчи спазват. Има много повече шум в сигнала, който може да попречи на алгоритъма, каза редакторът на Slate Politics Джошуа Кийтинг.

Трябва да вземем парите, които харчим за социологи, и трябва да вложим в организирането на място. Моето разбиране е, че Тръмп имаше хора на място за една година във Флорида. Бих искала да видя да разчитаме по-малко на социологически проучвания, защото става все по-малко съвършено, за да получим това, което искаме, каза конгресменът Прамила Джаяпал в уебинар ден след изборите.

Не пропускайте от Explained | Защо американците не са съгласни относно предоставянето на държавност на Пуерто Рико и Вашингтон, окръг Колумбия

Новинарските организации по подобен начин инвестират повече в анализ на тенденциите в интернет и отразяване на местните новини, за да компенсират грешките в анкетата.

Туфекчи каза: Вместо да опресняват страницата, за да актуализират прогнозите, хората трябваше да направят единственото нещо, което действително влияе на резултата: гласуване, дарение и организиране. Както разбрахме, всичко останало е в границите на грешка.