Metody kvantitativní analýzy: Odhad intervalů spolehlivosti. Intervaly spolehlivosti v Excelu: význam, definice, konstrukce a výpočet Interval spolehlivosti Statistica

💖 Líbí se vám? Sdílejte odkaz se svými přáteli

Analýza náhodných chyb je založena na teorii náhodných chyb, která umožňuje s určitou zárukou vypočítat skutečnou hodnotu naměřené hodnoty a vyhodnotit případné chyby.

Teorie náhodných chyb je založena na následujících předpokladech:

při velkém počtu měření se stejně často vyskytují náhodné chyby stejné velikosti, ale různých znamének;

velké chyby jsou méně časté než malé (pravděpodobnost chyby se snižuje s její velikostí);

při nekonečně velkém počtu měření se skutečná hodnota měřené veličiny rovná aritmetickému průměru všech výsledků měření;

výskyt jednoho nebo druhého výsledku měření jako náhodné události je popsán zákonem normálního rozdělení.

V praxi se rozlišuje obecný a vzorový soubor měření.

Pod populací implikují celou sadu možných naměřených hodnot nebo možných chybových hodnot
.

Pro vzorovou populaci počet měření omezené a přísně stanovené v každém konkrétním případě. Myslí si, že kdyby
, pak průměrnou hodnotu této sady měření je dostatečně blízko jeho skutečné hodnotě.

1. Intervalový odhad pomocí pravděpodobnosti spolehlivosti

Pro velký vzorek a normální rozdělení je obecnou vyhodnocovací charakteristikou měření disperze
a variační koeficient :

;
. (1.1)

Rozptyl charakterizuje homogenitu měření. Ten vyšší
, tím větší je rozptyl měření.

Variační koeficient charakterizuje variabilitu. Ten vyšší , tím větší je variabilita měření vzhledem k průměrným hodnotám.

Pro posouzení spolehlivosti výsledků měření jsou zavedeny pojmy interval spolehlivosti a pravděpodobnost spolehlivosti.

Důvěryhodný tzv. interval hodnoty , do které spadá skutečná hodnota měřená veličina s danou pravděpodobností.

Pravděpodobnost spolehlivosti (spolehlivost) měření je pravděpodobnost, že skutečná hodnota naměřené hodnoty spadá do daného intervalu spolehlivosti, tzn. do zóny
. Tato hodnota se určuje ve zlomcích jednotky nebo v procentech

,

Kde
- Laplaceova integrální funkce ( tabulka 1.1 )

Laplaceova integrální funkce je definována následujícím výrazem:

.

Argumentem této funkce je garanční faktor :

Tabulka 1.1

Laplaceova integrální funkce

Pokud je na základě určitých údajů stanovena pravděpodobnost spolehlivosti (často se to bere jako rovné
), pak je nastaveno přesnost měření (interval spolehlivosti
) na základě poměru

.

Poloviční interval spolehlivosti je

, (1.3)

Kde
- argument Laplaceovy funkce, jestliže
(tabulka 1.1 );

- Studentské funkce, pokud
(tabulka 1.2 ).

Interval spolehlivosti tedy charakterizuje přesnost měření daného vzorku a pravděpodobnost spolehlivosti charakterizuje spolehlivost měření.

Příklad

Hotovo
měření pevnosti povrchu vozovky dálničního úseku s průměrným modulem pružnosti
a vypočtená hodnota směrodatné odchylky
.

Nezbytné určit požadovanou přesnost měření pro různé úrovně spolehlivosti
, převzetí hodnot Podle tabulka 1.1 .

V tomto případě tedy |

V důsledku toho se pro daný prostředek a způsob měření interval spolehlivosti přibližně zvýší časy, pokud zvýšíte jen na
.

Jakýkoli vzorek poskytuje pouze přibližnou představu o obecné populaci a všechny statistické charakteristiky vzorku (průměr, modus, rozptyl...) jsou určitou aproximací nebo řekněme odhadem obecných parametrů, které ve většině případů není možné vypočítat kvůli k nedostupnosti běžné populace (obrázek 20) ​​.

Obrázek 20. Chyba vzorkování

Můžete ale určit interval, ve kterém s určitou mírou pravděpodobnosti leží skutečná (obecná) hodnota statistické charakteristiky. Tento interval se nazývá d interval spolehlivosti (CI).

Obecná průměrná hodnota s pravděpodobností 95 % tedy leží uvnitř

od do, (20)

Kde t – tabulková hodnota Studentova testu pro α = 0,05 a F= n-1

V tomto případě lze také nalézt 99% CI t vybráno pro α =0,01.

Jaký je praktický význam intervalu spolehlivosti?

    Široký interval spolehlivosti ukazuje, že průměr vzorku neodráží přesně průměr populace. To je obvykle způsobeno nedostatečnou velikostí vzorku, případně jeho heterogenitou, tzn. velký rozptyl. Oba dávají větší chybu průměru a v souladu s tím i širší CI. A to je základ pro návrat do fáze plánování výzkumu.

    Horní a dolní hranice CI poskytují odhad, zda budou výsledky klinicky významné

Zastavme se poněkud podrobněji u otázky statistické a klinické významnosti výsledků studia skupinových vlastností. Připomeňme, že úkolem statistiky je na základě výběrových dat odhalit alespoň nějaké rozdíly v obecných populacích. Výzvou pro klinické lékaře je odhalit rozdíly (ne ledajaké), které pomohou při diagnostice nebo léčbě. A statistické závěry nejsou vždy základem pro klinické závěry. Statisticky významný pokles hemoglobinu o 3 g/l tedy není důvodem k obavám. A naopak, pokud nějaký problém v lidském těle není rozšířen na úrovni celé populace, není to důvod se tímto problémem nezabývat.

Podívejme se na tuto situaci příklad.

Vědci si kladli otázku, zda chlapci, kteří prodělali nějakou infekční chorobu, nezaostávají v růstu za svými vrstevníky. Za tímto účelem byla provedena vzorová studie, které se zúčastnilo 10 chlapců, kteří trpěli tímto onemocněním. Výsledky jsou uvedeny v tabulce 23.

Tabulka 23. Výsledky statistického zpracování

spodní limit

horní limit

Normy (cm)

průměrný

Z těchto výpočtů vyplývá, že průměrná výška vzorku 10letých chlapců, kteří prodělali nějaké infekční onemocnění, se blíží normálu (132,5 cm). Spodní hranice intervalu spolehlivosti (126,6 cm) však ukazuje, že existuje 95% pravděpodobnost, že skutečná průměrná výška těchto dětí odpovídá pojmu „nízká výška“, tzn. tyto děti jsou zakrnělé.

V tomto příkladu jsou výsledky výpočtů intervalu spolehlivosti klinicky významné.

Odhadce musí často analyzovat trh s nemovitostmi v segmentu, ve kterém se posuzovaná nemovitost nachází. Pokud je trh rozvinutý, může být obtížné analyzovat celý soubor prezentovaných objektů, proto se pro analýzu používá vzorek objektů. Tento vzorek se ne vždy ukáže jako homogenní, někdy je nutné jej očistit od extrémních bodů – příliš vysokých nebo příliš nízkých tržních nabídek. K tomuto účelu se používá interval spolehlivosti. Účelem této studie je provést srovnávací analýzu dvou metod pro výpočet intervalu spolehlivosti a vybrat optimální možnost výpočtu při práci s různými vzorky v systému estimatica.pro.

Interval spolehlivosti je interval hodnot atributů vypočítaný na základě vzorku, který se známou pravděpodobností obsahuje odhadovaný parametr obecné populace.

Smyslem výpočtu intervalu spolehlivosti je sestrojit takový interval na základě výběrových dat, aby bylo možné s danou pravděpodobností konstatovat, že hodnota odhadovaného parametru je v tomto intervalu. Jinými slovy, interval spolehlivosti obsahuje s určitou pravděpodobností neznámou hodnotu odhadované hodnoty. Čím širší interval, tím vyšší nepřesnost.

Existují různé metody pro stanovení intervalu spolehlivosti. V tomto článku se podíváme na 2 způsoby:

  • prostřednictvím mediánu a standardní odchylky;
  • přes kritickou hodnotu t-statistiky (Studentův koeficient).

Etapy srovnávací analýzy různých metod pro výpočet CI:

1. vytvořit vzorek dat;

2. zpracováváme statistickými metodami: vypočítáme průměrnou hodnotu, medián, rozptyl atd.;

3. vypočítat interval spolehlivosti dvěma způsoby;

4. analyzujte vyčištěné vzorky a výsledné intervaly spolehlivosti.

Fáze 1. Vzorkování dat

Vzorek byl vytvořen pomocí systému estimatica.pro. Vzorek obsahoval 91 nabídek na prodej 1+1 bytů ve 3. cenové zóně dispozičního typu „Chruščov“.

Tabulka 1. Počáteční vzorek

Cena 1 m2, jednotky

Obr. 1. Počáteční vzorek



Fáze 2. Zpracování počátečního vzorku

Zpracování vzorku pomocí statistických metod vyžaduje výpočet následujících hodnot:

1. Aritmetický průměr

2. Medián je číslo charakterizující vzorek: přesně polovina prvků vzorku je větší než medián, druhá polovina je menší než medián

(pro vzorek s lichým počtem hodnot)

3. Rozsah - rozdíl mezi maximální a minimální hodnotou ve vzorku

4. Rozptyl – používá se k přesnějšímu odhadu variace dat

5. Vzorová směrodatná odchylka (dále jen SD) je nejběžnějším ukazatelem rozptylu hodnot úprav kolem aritmetického průměru.

6. Variační koeficient – ​​odráží míru rozptylu hodnot úprav

7. oscilační koeficient - odráží relativní kolísání extrémních cenových hodnot ve vzorku kolem průměru

Tabulka 2. Statistické ukazatele původního vzorku

Variační koeficient, který charakterizuje homogenitu dat, je 12,29 %, ale koeficient oscilace je příliš vysoký. Můžeme tedy říci, že původní vzorek není homogenní, přejdeme tedy k výpočtu intervalu spolehlivosti.

Fáze 3. Výpočet intervalu spolehlivosti

Metoda 1. Výpočet pomocí mediánu a směrodatné odchylky.

Interval spolehlivosti se stanoví následovně: minimální hodnota - standardní odchylka se odečte od mediánu; maximální hodnota - směrodatná odchylka se přičte k mediánu.

Interval spolehlivosti (47179 CU; 60689 CU)

Rýže. 2. Hodnoty spadající do intervalu spolehlivosti 1.



Metoda 2. Sestrojení intervalu spolehlivosti pomocí kritické hodnoty t-statistiky (Studentův koeficient)

S.V. Gribovský ve své knize „Mathematical Methods for Estimating Property Value“ popisuje metodu pro výpočet intervalu spolehlivosti pomocí Studentova koeficientu. Při výpočtu touto metodou musí odhadce sám nastavit hladinu významnosti ∝, která určuje pravděpodobnost, se kterou bude konstruován interval spolehlivosti. Typicky se používají hladiny významnosti 0,1; 0,05 a 0,01. Odpovídají pravděpodobnosti spolehlivosti 0,9; 0,95 a 0,99. U této metody se předpokládá, že skutečné hodnoty matematického očekávání a rozptylu jsou prakticky neznámé (což platí téměř vždy při řešení praktických úloh odhadu).

Vzorec intervalu spolehlivosti:

n - velikost vzorku;

Kritická hodnota t-statistiky (Studentovo rozdělení) s hladinou významnosti ∝, počet stupňů volnosti n-1, která se určuje ze speciálních statistických tabulek nebo pomocí MS Excel ( → "Statistické" → STUDRIST);

∝ - hladina významnosti, vezměte ∝=0,01.

Rýže. 2. Hodnoty spadající do intervalu spolehlivosti 2.

Fáze 4. Analýza různých metod pro výpočet intervalu spolehlivosti

Dvě metody výpočtu intervalu spolehlivosti - prostřednictvím mediánu a Studentova koeficientu - vedly k různým hodnotám intervalů. V souladu s tím jsme získali dva různé vyčištěné vzorky.

Tabulka 3. Statistika pro tři vzorky.

Index

Počáteční vzorek

1 možnost

Možnost 2

Průměrná hodnota

Disperze

Coef. variace

Coef. oscilace

Počet vysloužilých předmětů, ks.

Na základě provedených výpočtů můžeme říci, že hodnoty intervalu spolehlivosti získané různými metodami se prolínají, takže můžete použít kteroukoli z metod výpočtu podle uvážení odhadce.

Domníváme se však, že při práci v systému estimatica.pro je vhodné zvolit metodu výpočtu intervalu spolehlivosti v závislosti na stupni vývoje trhu:

  • pokud trh není rozvinutý, použijte metodu výpočtu s použitím mediánu a směrodatné odchylky, protože počet vyřazených objektů je v tomto případě malý;
  • pokud je trh rozvinutý, aplikujte výpočet přes kritickou hodnotu t-statistiky (Studentův koeficient), protože je možné vytvořit velký počáteční vzorek.

Při přípravě článku bylo použito následující:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematické metody pro stanovení hodnoty nemovitosti. Moskva, 2014

2. Systémová data estimatica.pro

Odebráním vzorku ze základního souboru získáme bodový odhad sledovaného parametru a vypočítáme směrodatnou chybu pro vyjádření přesnosti odhadu.

Ve většině případů však standardní chyba jako taková není přijatelná. Mnohem užitečnější je kombinovat tuto míru přesnosti s intervalovým odhadem pro parametr populace.

To lze provést pomocí znalosti teoretického rozdělení pravděpodobnosti výběrové statistiky (parametru) za účelem výpočtu intervalu spolehlivosti (CI - Interval spolehlivosti, DI – Interval spolehlivosti) pro parametr.

Vůbec, interval spolehlivosti rozšiřuje odhady v obou směrech o určitou hodnotu, která je násobkem směrodatné chyby (daného parametru); dvě hodnoty (mezi spolehlivosti) definující interval jsou obvykle odděleny čárkou a uzavřeny v závorkách.

Ve statistice a interval spolehlivosti(CI) je typ intervalového odhadu parametru populace. Je to pozorovaný interval (tj. vypočítá se z pozorování), v principu odlišný od vzorku k vzorku, který často zahrnuje hodnotu nepozorovatelného parametru zájmu, pokud se experiment opakuje. Jak často sledovaný interval obsahuje parametr, je určeno hladinou spolehlivosti nebo koeficientem spolehlivosti. Přesněji řečeno, význam termínu „úroveň spolehlivosti“ je takový, že pokud je CI konstruována napříč mnoha samostatnými analýzami dat z replikovaných (a možná odlišných) experimentů, bude podíl takových intervalů, které obsahují skutečnou hodnotu parametru, odpovídat danému úroveň důvěry Zatímco dvoustranné meze spolehlivosti tvoří interval spolehlivosti, jejich jednostranné protějšky se označují jako dolní/horní meze spolehlivosti (neboli limity).


Interval spolehlivosti ukazuje, v jakém rozmezí se budou nacházet výsledky výběrových pozorování (průzkumů). Pokud provedeme 100 identických průzkumů v identických vzorcích z jedné populace (například 100 vzorků po 1 000 lidech ve městě s 5 miliony obyvatel), pak při 95% hladině spolehlivosti bude 95 ze 100 výsledků spadat do interval spolehlivosti (například od 28 % do 32 % se skutečnou hodnotou 30 %). Například skutečný počet obyvatel města, kteří kouří, je 30 %. Pokud vybereme 1000 lidí 100krát za sebou a zeptáme se v těchto vzorcích na otázku „Kouříš?“, v 95 z těchto 100 vzorků s 2% intervalem spolehlivosti bude hodnota od 28 % do 32 %.

Vzorce pro konstrukci intervalů spolehlivosti s praktickými příklady lze nalézt např.

Interpretace intervalů spolehlivosti

Při interpretaci intervalu spolehlivosti nás zajímají následující otázky:

Jak široký je interval spolehlivosti?

Široký interval spolehlivosti naznačuje, že odhad je nepřesný; úzký označuje přesný odhad.
Šířka intervalu spolehlivosti závisí na velikosti standardní chyby, která zase závisí na velikosti vzorku, a když uvažujeme numerickou proměnnou, variabilita dat vytváří širší intervaly spolehlivosti než studie velkého souboru dat s několika proměnnými. .

Obsahuje CI nějaké hodnoty, které jsou zvláště zajímavé?

Můžete zkontrolovat, zda pravděpodobná hodnota parametru populace spadá do intervalu spolehlivosti. Pokud ano, výsledky jsou v souladu s touto pravděpodobnou hodnotou. Pokud ne, pak je nepravděpodobné (pro 95% interval spolehlivosti je šance téměř 5%), že parametr má tuto hodnotu. ()

Jednou z metod řešení statistických problémů je výpočet intervalu spolehlivosti. Používá se jako výhodnější alternativa k bodovému odhadu, když je velikost vzorku malá. Je třeba poznamenat, že samotný proces výpočtu intervalu spolehlivosti je poměrně složitý. Nástroje programu Excel vám to ale umožňují poněkud zjednodušit. Pojďme zjistit, jak se to dělá v praxi.

Tato metoda se používá pro intervalový odhad různých statistických veličin. Hlavním úkolem tohoto výpočtu je zbavit se nejistot bodového odhadu.

V Excelu existují dvě hlavní možnosti pro provádění výpočtů pomocí této metody: když je rozptyl známý a když je neznámý. V prvním případě se funkce používá pro výpočty DŮVĚŘOVAT.NORM a ve druhém - DŮVĚRNÍK.STUDENT.

Metoda 1: Funkce CONFIDENCE NORM

Operátor DŮVĚŘOVAT.NORM, který patří do statistické skupiny funkcí, se poprvé objevil v Excelu 2010. Dřívější verze tohoto programu používají jeho analog DŮVĚRA. Účelem tohoto operátoru je vypočítat normálně rozdělený interval spolehlivosti pro průměr populace.

Jeho syntaxe je následující:

CONFIDENCE.NORM(alfa;standardní_vypnuto;velikost)

"alfa"— argument udávající hladinu významnosti, která se používá k výpočtu hladiny spolehlivosti. Úroveň spolehlivosti se rovná následujícímu výrazu:

(1-"Alfa")*100

"Standardní odchylka"- To je argument, jehož podstata je zřejmá z názvu. Toto je standardní odchylka navrhovaného vzorku.

"Velikost"— argument definující velikost vzorku.

Všechny argumenty pro tento operátor jsou povinné.

Funkce DŮVĚRA má úplně stejné argumenty a možnosti jako předchozí. Jeho syntaxe je:

TRUST(alfa; standardní_vypnuto; velikost)

Jak vidíte, rozdíly jsou pouze ve jménu operátora. Z důvodu kompatibility je tato funkce v Excelu 2010 a novějších verzích ponechána ve speciální kategorii "Kompatibilita". Ve verzích Excelu 2007 a starších je přítomen v hlavní skupině statistických operátorů.

Limit intervalu spolehlivosti se určuje pomocí následujícího vzorce:

X+(-)SEVĚDOMÍ NORM

Kde X je průměrná hodnota vzorku, která se nachází uprostřed zvoleného rozsahu.

Nyní se podíváme na to, jak vypočítat interval spolehlivosti pomocí konkrétního příkladu. Bylo provedeno 12 testů, jejichž výsledkem byly různé výsledky, uvedené v tabulce. Toto je naše totalita. Standardní odchylka je 8. Potřebujeme vypočítat interval spolehlivosti na hladině spolehlivosti 97 %.

  1. Vyberte buňku, kde se zobrazí výsledek zpracování dat. Klikněte na tlačítko "Vložit funkci".
  2. Objeví se Průvodce funkcí. Přejít do kategorie "Statistický" a zvýrazněte jméno "TRUST.NORM". Poté klikněte na tlačítko "OK".
  3. Otevře se okno s argumenty. Jeho pole přirozeně odpovídají názvům argumentů.
    Umístěte kurzor do prvního pole - "alfa". Zde bychom měli uvést úroveň významnosti. Jak si pamatujeme, naše úroveň důvěry je 97 %. Zároveň jsme řekli, že se to počítá takto:

    (1-úroveň důvěry)/100

    To znamená, že dosazením hodnoty získáme:

    Jednoduchými výpočty zjistíme, že argument "alfa" rovná se 0,03 . Zadejte tuto hodnotu do pole.

    Jak je známo, podle podmínky je standardní odchylka rovna 8 . Proto v terénu "Standardní odchylka" stačí napsat toto číslo.

    V terénu "Velikost" musíte zadat počet provedených testovacích prvků. Jak si pamatujeme, jejich 12 . Abychom ale vzorec zautomatizovali a neupravovali ho pokaždé, když provádíme nový test, nastavme tuto hodnotu ne obyčejným číslem, ale pomocí operátoru ŠEK. Umístíme tedy kurzor do pole "Velikost" a poté klikněte na trojúhelník, který se nachází vlevo od řádku vzorců.

    Zobrazí se seznam naposledy použitých funkcí. Pokud operátor ŠEK byl vámi nedávno použit, měl by být na tomto seznamu. V tomto případě stačí kliknout na jeho název. V opačném případě, pokud to nenajdete, přejděte k věci "Další funkce...".

  4. Objeví se již známý Průvodce funkcí. Vraťme se znovu ke skupině "Statistický". Jméno tam zvýrazníme "ŠEK". Klikněte na tlačítko "OK".
  5. Zobrazí se okno argumentů pro výše uvedený příkaz. Tato funkce je určena k výpočtu počtu buněk v určeném rozsahu, které obsahují číselné hodnoty. Jeho syntaxe je následující:

    POČET(hodnota1;hodnota2;…)

    Skupina argumentů "hodnoty" je odkaz na rozsah, ve kterém chcete vypočítat počet buněk vyplněných číselnými údaji. Takových argumentů může být celkem až 255, ale v našem případě potřebujeme pouze jeden.

    Umístěte kurzor do pole "Hodnota 1" a podržením levého tlačítka myši vyberte na listu řadu, která obsahuje naši kolekci. Poté se v poli zobrazí jeho adresa. Klikněte na tlačítko "OK".

  6. Poté aplikace provede výpočet a zobrazí výsledek v buňce, kde se nachází. V našem konkrétním případě vzorec vypadal takto:

    CONFIDENCE NORM(0,03;8;POČET(B2:B13))

    Celkový výsledek výpočtů byl 5,011609 .

  7. Ale to není vše. Jak si pamatujeme, mez intervalu spolehlivosti se vypočítává přičtením a odečtením výsledku výpočtu od průměru vzorku DŮVĚŘOVAT.NORM. Tímto způsobem se vypočítá pravá a levá hranice intervalu spolehlivosti. Samotný výběrový průměr lze vypočítat pomocí operátoru PRŮMĚRNÝ.

    Tento operátor je určen k výpočtu aritmetického průměru vybraného rozsahu čísel. Má následující poměrně jednoduchou syntaxi:

    AVERAGE(číslo1,číslo2,…)

    Argument "Číslo" může být buď jedna číselná hodnota nebo odkaz na buňky nebo dokonce celé rozsahy, které je obsahují.

    Vyberte tedy buňku, ve které se zobrazí výpočet průměrné hodnoty, a klikněte na tlačítko "Vložit funkci".

  8. Otevře se Průvodce funkcí. Návrat ke kategorii "Statistický" a vyberte jméno ze seznamu "PRŮMĚRNÝ". Jako vždy klikněte na tlačítko "OK".
  9. Otevře se okno s argumenty. Umístěte kurzor do pole "Číslo 1" a podržením levého tlačítka myši vyberte celý rozsah hodnot. Po zobrazení souřadnic v poli klikněte na tlačítko "OK".
  10. Potom PRŮMĚRNÝ zobrazí výsledek výpočtu v prvku listu.
  11. Vypočítáme pravou hranici intervalu spolehlivosti. Chcete-li to provést, vyberte samostatnou buňku a vložte znaménko «=» a sečtěte obsah prvků listu, ve kterých jsou umístěny výsledky výpočtů funkcí PRŮMĚRNÝ A DŮVĚŘOVAT.NORM. Pro provedení výpočtu stiskněte tlačítko Vstupte. V našem případě jsme dostali následující vzorec:

    Výsledek výpočtu: 6,953276

  12. Stejným způsobem vypočítáme levou mez intervalu spolehlivosti, pouze tentokrát z výsledku výpočtu PRŮMĚRNÝ odečtěte výsledek výpočtu operátora DŮVĚŘOVAT.NORM. Výsledný vzorec pro náš příklad je následujícího typu:

    Výsledek výpočtu: -3,06994

  13. Snažili jsme se podrobně popsat všechny kroky pro výpočet intervalu spolehlivosti, proto jsme podrobně popsali každý vzorec. Všechny akce ale můžete spojit do jednoho vzorce. Výpočet pravé hranice intervalu spolehlivosti lze zapsat následovně:

    AVERAGE(B2:B13)+CONFIDENCE.NORM(0.03;8;COUNT(B2:B13))

  14. Podobný výpočet pro levý okraj by vypadal takto:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03;8;COUNT(B2:B13))

Metoda 2: Funkce TRUST.STUDENT

Kromě toho má Excel další funkci, která je spojena s výpočtem intervalu spolehlivosti - DŮVĚRNÍK.STUDENT. Objevil se pouze v Excelu 2010. Tento operátor počítá interval spolehlivosti populace pomocí Studentova rozdělení. Je velmi vhodné použít, když rozptyl a tedy i směrodatná odchylka nejsou známy. Syntaxe operátoru je:

CONFIDENCE.STUDENT(alfa;standardní_off;velikost)

Jak je vidět, jména operátorů zůstala v tomto případě nezměněna.

Podívejme se, jak vypočítat hranice intervalu spolehlivosti s neznámou směrodatnou odchylkou na příkladu stejné populace, kterou jsme uvažovali v předchozí metodě. Vezměme úroveň důvěry jako minule na 97 %.

  1. Vyberte buňku, ve které bude výpočet proveden. Klikněte na tlačítko "Vložit funkci".
  2. V otevřeném Průvodce funkcí přejděte do kategorie "Statistický". Vyberte jméno "DŮVĚRYHODNÝ STUDENT". Klikněte na tlačítko "OK".
  3. Otevře se okno argumentů pro zadaný operátor.

    V terénu "alfa", vzhledem k tomu, že hladina spolehlivosti je 97 %, zapíšeme si číslo 0,03 . Podruhé se nebudeme zdržovat principy výpočtu tohoto parametru.

    Poté umístěte kurzor do pole "Standardní odchylka". Tentokrát nám tento ukazatel není znám a je potřeba jej spočítat. To se provádí pomocí speciální funkce - STDEV.V. Chcete-li otevřít okno tohoto operátoru, klikněte na trojúhelník vlevo od řádku vzorců. Pokud nenajdeme požadované jméno v seznamu, který se otevře, přejděte na položku "Další funkce...".

  4. Začíná Průvodce funkcí. Přesun do kategorie "Statistický" a označte v něm jméno "STDEV.B". Poté klikněte na tlačítko "OK".
  5. Otevře se okno s argumenty. Úkol operátora STDEV.V je určit směrodatnou odchylku vzorku. Jeho syntaxe vypadá takto:

    STANDARDNÍ ODCHYLKA.B(číslo1;číslo2;…)

    Není těžké uhodnout, že argument "Číslo" je adresa prvku výběru. Pokud je výběr umístěn v jediném poli, můžete k poskytnutí odkazu na tento rozsah použít pouze jeden argument.

    Umístěte kurzor do pole "Číslo 1" a jako vždy podržením levého tlačítka myši vyberte kolekci. Jakmile jsou souřadnice v poli, nespěchejte se stisknutím tlačítka "OK", protože výsledek bude nesprávný. Nejprve se musíme vrátit do okna argumentů operátora DŮVĚRNÍK.STUDENT přidat poslední argument. Chcete-li to provést, klikněte na odpovídající název v řádku vzorců.

  6. Znovu se otevře okno argumentů pro již známou funkci. Umístěte kurzor do pole "Velikost". Opět kliknutím na trojúhelník, který již známe, přejdeme k výběru operátorů. Jak jste pochopili, potřebujeme jméno "ŠEK". Protože jsme tuto funkci použili ve výpočtech v předchozí metodě, je v tomto seznamu přítomna, takže na ni stačí kliknout. Pokud jej nenajdete, postupujte podle algoritmu popsaného v první metodě.
  7. Jednou v okně argumentů ŠEK, umístěte kurzor do pole "Číslo 1" a při stisknutém tlačítku myši vyberte kolekci. Poté klikněte na tlačítko "OK".
  8. Poté program provede výpočet a zobrazí hodnotu intervalu spolehlivosti.
  9. Pro určení hranic budeme opět muset vypočítat výběrový průměr. Ale vzhledem k tomu, že výpočetní algoritmus pomocí vzorce PRŮMĚRNÝ stejně jako u předchozího způsobu a ani výsledek se nezměnil, nebudeme se tím podruhé podrobně zabývat.
  10. Sčítání výsledků výpočtu PRŮMĚRNÝ A DŮVĚRNÍK.STUDENT, získáme pravou hranici intervalu spolehlivosti.
  11. Odečtením od výsledků výpočtu operátora PRŮMĚRNÝ výsledek výpočtu DŮVĚRNÍK.STUDENT, máme levou mez intervalu spolehlivosti.
  12. Pokud je výpočet zapsán v jednom vzorci, bude výpočet pravé hranice v našem případě vypadat takto:

    AVERAGE(B2:B13)+CONFIDENCE.STUDENT(0,03;STDEV.B(B2:B13);COUNT(B2:B13))

  13. Podle toho bude vzorec pro výpočet levého okraje vypadat takto:

    AVERAGE(B2:B13)-CONFIDENCE.STUDENT(0,03;STDEV.B(B2:B13);COUNT(B2:B13))

Jak vidíte, nástroje Excelu výrazně usnadňují výpočet intervalu spolehlivosti a jeho hranic. Pro tyto účely se používají samostatné operátory pro vzorky, jejichž rozptyl je známý a neznámý.

říct přátelům