Presný odhad

Presný odhad

Vysvetlíme, aký je bodový odhad, jeho vlastnosti, metódy. Okrem toho sme uviedli príklad a vyriešené cvičenia

Aký je presný odhad?

Ten Presný odhad Zo štatistických parametrov niektorých charakteristík populácie sa vykonáva z jednej alebo viacerých vzoriek uvedených charakteristických, reprezentovaných ako náhodná premenná.

Populácie môžu byť rozmanité: ženy mesta, pacientmi nemocnice, skrutky vyrobené určitým priemyslom za mesiac a mnoho ďalších.

V populácii žien v meste sa štatistická štúdia môže zamerať na rôzne charakteristiky tejto populácie: napríklad veľkosť obuvi, výška, miera pása, farba vlasov, počet detí, vek a nespočetné množstvo ďalších charakteristík.

Akonáhle sa vyberie populácia a charakteristika, ktorá sa chcú podrobiť štatistickej štúdii, vyberie sa vzorka veľkosti n, čo je zvyčajne dosť menšie ako veľkosť N z celkovej populácie.

Vlastnosti presného odhadu

Známe údaje vzorky, ktoré sú znázornené náhodnou premennou X, Sú zastúpené súborom n Skutočné čísla: (x1, X2,.. ., Xn).

S týmito údajmi je možné vypočítať niektoré štatistiky vzorky:

  • Vzorový priemer: = (x1+X2,.. ., +Xn)/n.
  • Vzorový rozptyl: Siež2 = [x1 ~ )2 +.. . +(Xn )2]/n.
  • Vzorka kvázi Variza: Scrping2 = [x1 ~ )2 +.. . +(Xn )2]/(N 1).
Normálne rozdelenie populácie s centrálnou hodnotou μ a odchýlkou ​​Sigma σ

Na druhej strane, Populácia priemer μ a Rozptyl populácie σ2 Vyžadovali by znalosť všetkých údajov o celkovej populácii, ktorá má veľkosť N >> n. V dôsledku toho je často nemožné presne poznať parametre populácie.

Vzhľadom na to sa hodnoty populácie zvyčajne približujú podľa hodnôt vzorky, aproximácia známa ako Presný odhad. SiežBude to dobré alebo zlé, v závislosti najmä od množstva údajov a kvality vzorky. Vzorka je známa ako odhad.

Môže vám slúžiť: Cotangent odvodené: výpočet, demonštrácia, cvičenia

Dobrý odhadca musí mať určité požadované vlastnosti alebo vlastnosti:

  • Súdržnosť
  • Minimálna variácia 
  • Účinnosť.

1.- Súdržnosť

Vzorka musí mať dostatočný počet údajov, aby odhad parametrov bol konzistentný. Napríklad, ak sa odoberia tri alebo viac vzoriek a štatistiky vzorky sú navzájom veľmi odlišné, potom by nebolo vhodné brať žiadny z týchto výsledkov ako konkrétny odhad. 

Vo väčšine prípadov stačí odobrať vzorky väčšieho počtu údajov, takže štatistické parametre získané od nich začnú vykazovať konvergenciu alebo náhodu, vždy s určitou toleranciou. V prípade, že nedôjde k konvergencii, napriek zvýšeniu údajov by sa ich kvalita mala preskúmať, pretože by mohli mať zaujatosť, alebo sa jednoducho zle vzali.

2.- Minimálna variabilita

Ak je k dispozícii niekoľko odhadcov, ktorých priemerné hodnoty sa zhodujú s určitou toleranciou, sú vybrané tie, ktoré majú najmenší rozptyl vzorky.

3.- Účinnosť

Odhad N je účinný od okamihu, keď odchýlky vzorky pančúch majú tendenciu nula, pretože N má tendenciu nekonečno. Sa volá Asymptotická účinnosť odhadcu.

Metódy

Nižšie sú uvedené niektoré postupy alebo metódy, ktoré umožnia úspešný presný odhad parametrov populácie, počnúc vzorkou.

1.-Náhodný oddiel

Používa sa náhodný oddiel vzorky na kontrolu konzistencie. Táto metóda spočíva v odobratí vzorky veľkosti n a náhodne ju rozdelí na dve vzorky, každá s veľkosťou n/2.

Ak sa priemer vzorky a rozptyl vzorky zhodujú s určitým počtom významných čísel, zvyčajne 2 alebo 3 obrázky, potom sa dá povedať, že medzi nimi existuje koherencia.

Môže vám slúžiť: Multiplikatívny princíp: Techniky počítania a príklady

Na druhej strane, ak existuje náhoda na úrovni významných čísel medzi štatistickými parametrami vypočítanými pomocou pôvodnej vzorky veľkosti N a dvoma podskupinami, existuje aj konvergencia a dá sa potvrdiť, že veľkosť vzorky je dostatočná. V opačnom prípade by bolo potrebné vziať ďalšie údaje, zvýšiť množstvo vzorových údajov.

2.- Spôsob režimu

Táto metóda má zodpovedať momentom náhodnej vzorky veľkosti n, s tými, ktoré sa získavajú od kandidáta na distribúciu vzorky. Ak má distribúcia kandidátov M parametre, potom bude potrebné vyrovnať sa s mami.

3.- Metóda maximálnej dôveryhodnosti

Navrhol ho Fisher, jeden z rodičov štatistickej vedy, približne pred sto rokmi. Spočíva v optimalizácii alebo maximalizácii pravdepodobnosti výskytu určitej sady hodnôt vzorky.

Príklad

Predpokladajme, že správanie určitej populačnej premennej sa riadi exponenciálnym rozdelením, ktorého hustota pravdepodobnosti je daná:

 f (x; λ) = λ ⋅ exp (−λrem)

Je to jednoznačne jedným rozdelením parametrov λ.

Na odhad uvedeného parametra populácie je možné použiť náhodnú vzorku veľkosti n, ktorej výsledky sú nasledujúce: (x1, X2,.. ., Xn)

Získa sa prvý moment vzorky, čo je priemerná hodnota prostredníctvom:

= (x1 + X2 +… + Xn) / n

Dá sa preukázať, že prvým momentom exponenciálneho rozdelenia je integrál 0 do nekonečna funkcie x⋅f (x; λ) a jeho výsledok je 1/λ.

Rovnako ako moment vzorky s rozložením populácie sa dospelo k záveru, že špecifický odhad λ je 1/.

Vyriešené cvičenia

Cvičenie 1

V štúdii vykonanej so 100 údajmi sa zistilo, že priemerný čas, ktorý človek vyžaduje na vizualizáciu videa YouTube, po prijatí oznámenia, je 3 minúty. Po prijatí oznámenia nájdite distribúciu pravdepodobnosti času, ktorý sa používa na videnie videa.

Môže vám slúžiť: y = 3sen (4x) funkčné obdobie

Riešenie

Bude sa predpokladať, že maximálna pravdepodobnosť, že osoba skontroluje video, sa vyskytuje hneď po upozornení, ale ak prechádza dlho po ňom, pravdepodobnosť, že táto osoba vidí, je veľmi nízka.

Toto je typické správanie exponenciálneho rozdelenia, preto sa populačné správanie môže modelovať pomocou nasledujúceho rozdelenia pravdepodobnosti pre čas t (v minútach), merané od oznámenia:

 f (t; λ) = λ ⋅ exp (−λrem)

V tomto type distribúcie je nádej alebo priemer = 1/λ, ako je vysvetlené v predchádzajúcej časti. Potom zo vzorových informácií môžete približovať λ:

λ ≈ ⅓.

Cvičenie 2

Prieskum sa vykonáva s jednou otázkou, ktorej možné odpovede sú: áno (1) alebo nie (0). Výsledky prieskumu, v ktorom všetci odpovedali, boli: 26 áno a 14 nie.

Za predpokladu, že odpoveď je náhodná, takže distribúcia týchto výsledkov je binomické rozdelenie ktorého pravdepodobnosť je:

P = p26 · (1 -p)14

Dá sa preukázať, že maximálne z tejto funkcie nastane, keď P má hodnotu 26/40, a to je hodnota, ktorá spôsobuje získanie hodnôt vzorky.