Anonim

De theorie achter p- waarden en de nulhypothese lijken op het eerste gezicht misschien ingewikkeld, maar als u de concepten begrijpt, kunt u door de wereld van statistieken navigeren. Helaas worden deze termen vaak misbruikt in de populaire wetenschap, dus het zou nuttig zijn voor iedereen om de basis te begrijpen.

Zie ook ons ​​artikel Hoe elke andere rij in Excel te verwijderen

De p- waarde van een model berekenen en de nulhypothese bewijzen / weerleggen is verrassend eenvoudig met MS Excel. Er zijn twee manieren om dit te doen en we behandelen ze allebei. Laten we ingaan.

Null-hypothese en p -waarde

De nulhypothese is een verklaring, ook wel een standaardpositie genoemd, die beweert dat de relatie tussen de waargenomen verschijnselen niet bestaat. Het kan ook worden toegepast op associaties tussen twee waargenomen groepen. Tijdens het onderzoek test je deze hypothese en probeer je deze te weerleggen.

Stel bijvoorbeeld dat u wilt observeren of een bepaald rage-dieet significante resultaten heeft. De nulhypothese is in dit geval dat er geen significant verschil is in het gewicht van de proefpersonen voor en na een dieet. De alternatieve hypothese is dat het dieet een verschil maakte. Dit is wat onderzoekers zouden proberen te bewijzen.

De p- waarde vertegenwoordigt de kans dat de statistische samenvatting gelijk is aan of groter is dan de waargenomen waarde wanneer de nulhypothese waar is voor een bepaald statistisch model. Hoewel het vaak wordt uitgedrukt als een decimaal getal, is het over het algemeen beter om het als een percentage uit te drukken. De p- waarde van 0, 1 moet bijvoorbeeld worden weergegeven als 10%.

Een lage p- waarde betekent dat het bewijs tegen de nulhypothese sterk is. Dit betekent verder dat uw gegevens aanzienlijk zijn. Aan de andere kant betekent een hoge p- waarde dat er geen sterk bewijs is tegen de hypothese. Om te bewijzen dat het rage-dieet werkt, zouden onderzoekers een lage p- waarde moeten vinden.

Een statistisch significant resultaat is het resultaat dat hoogst onwaarschijnlijk is als de nulhypothese waar is. Het significantieniveau wordt aangegeven met de Griekse letter alfa en het moet groter zijn dan de p- waarde om het resultaat statistisch significant te maken.

Veel onderzoekers in een breed scala van velden gebruiken de p- waarde om een ​​beter en dieper inzicht te krijgen in de gegevens waarmee ze werken. Enkele van de prominente gebieden zijn sociologie, strafrecht, psychologie, financiën en economie.

De p -Waarde vinden in Excel

U kunt de p- waarde van een gegevensset in MS Excel vinden via de T-Test-functie of met behulp van de tool Gegevensanalyse. Eerst zullen we de T-Test-functie bekijken. We zullen vijf studenten onderzoeken die een dieet van 30 dagen hebben gevolgd. We vergelijken hun gewicht voor en na het dieet.

OPMERKING: Voor de toepassing van dit artikel gebruiken we MS Excel 2010. Hoewel dit niet de meest recente is, moeten de stappen over het algemeen ook van toepassing zijn op de nieuwere versies.

T-testfunctie

Volg deze stappen om de p- waarde te berekenen met de T-Test-functie.

  1. Maak en vul de tabel. Onze tafel ziet er zo uit:

  2. Klik op een cel buiten uw tafel.
  3. Voer in: = T.Test (.
  4. Typ na de open haak het eerste argument. In dit voorbeeld is dit de kolom Vóór dieet. Het bereik moet B2: B6 zijn. Tot nu toe ziet de functie er als volgt uit: T.Test (B2: B6.
  5. Vervolgens zullen we het tweede argument invoeren. De kolom Na dieet en de resultaten zijn ons tweede argument en het bereik dat we nodig hebben is C2: C6. Laten we het toevoegen aan de formule: T.Test (B2: B6, C2: C6.
  6. Typ een komma na het tweede argument en de eenzijdige distributie- en tweezijdige distributie-opties verschijnen automatisch in een vervolgkeuzemenu. Laten we de eerste kiezen - eenzijdige distributie. Dubbelklik erop.
  7. Typ een andere komma.
  8. Dubbelklik op de optie Gekoppeld in het volgende vervolgkeuzemenu.
  9. Nu je alle elementen hebt die je nodig hebt, sluit je de beugel. De formule voor dit voorbeeld ziet er als volgt uit: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Druk op Enter. De cel geeft de p- waarde onmiddellijk weer. In ons geval is de waarde 0, 133906 of 13, 3906%.

Deze p- waarde is hoger dan 5% en biedt geen sterk bewijs tegen de nulhypothese. In ons voorbeeld heeft het onderzoek niet bewezen dat diëten de testpersonen heeft geholpen een aanzienlijke hoeveelheid gewicht te verliezen. Dit betekent niet noodzakelijk dat de nulhypothese correct is, alleen dat deze nog niet is bewezen.

Route voor gegevensanalyse

Met de tool Gegevensanalyse kunt u veel leuke dingen doen, waaronder p- waardeberekeningen. Om het eenvoudiger te maken, gebruiken we dezelfde tabel als in de vorige methode.

Hier is hoe het is gedaan.

  1. Omdat we al de gewichtsverschillen in de kolom D hebben, slaan we de verschilberekening over. Gebruik voor de toekomstige tabellen deze formule: = "Cel 1" - "Cel 2".
  2. Klik vervolgens op het tabblad Gegevens in het hoofdmenu.
  3. Selecteer de tool Gegevensanalyse.
  4. Blader naar beneden in de lijst en klik op de optie t-Test: Paired Two Sample for Means.
  5. Klik OK.
  6. Er verschijnt een pop-upvenster. Het ziet er zo uit:

  7. Voer het eerste bereik / argument in. In ons voorbeeld is dit B2: B6.
  8. Voer het tweede bereik / argument in. In dit geval is het C2: C6.
  9. Laat de standaardwaarde in het tekstvak Alfa (dit is 0, 05).
  10. Klik op het keuzerondje Uitvoerbereik en kies waar u het resultaat wilt. Als het de A8-cel is, typt u: $ A $ 8.
  11. Klik OK.
  12. Excel berekent de p- waarde en verschillende andere parameters. De finaletafel kan er zo uitzien:

Zoals u kunt zien, is de eenzijdige p- waarde hetzelfde als in het eerste geval - 0.133905569. Omdat het hoger is dan 0, 05, is de nulhypothese van toepassing op deze tabel en is het bewijs ertegen zwak.

Dingen om te weten over de p-waarde

Hier zijn enkele nuttige tips over p- waardeberekeningen in Excel.

  1. Als de p- waarde gelijk is aan 0, 05 (5%), zijn de gegevens in uw tabel significant. Als het minder is dan 0, 05 (5%), zijn de gegevens die u hebt zeer belangrijk.
  2. Als de p- waarde meer dan 0, 1 (10%) is, zijn de gegevens in uw tabel onbeduidend. Als het binnen het bereik 0, 05-0, 10 ligt, hebt u marginaal significante gegevens.
  3. U kunt de alfawaarde wijzigen, hoewel de meest voorkomende opties 0, 05 (5%) en 0, 10 (10%) zijn.
  4. Het kiezen van tweezijdige testen kan de betere keuze zijn, afhankelijk van uw hypothese. In het bovenstaande voorbeeld betekent eenzijdig testen dat we onderzoeken of de testpersonen na hun dieet afgevallen zijn, en dat is precies wat we nodig hadden om erachter te komen. Maar een tweezijdige test zou ook onderzoeken of ze statistisch significante hoeveelheden aankwamen.
  5. De p- waarde kan geen variabelen identificeren. Met andere woorden, als het een correlatie identificeert, kan het de oorzaken erachter niet identificeren.

De p-waarde Demystified

Elke statisticus die zijn zout waard is, moet de ins en outs van nul-hypothesetesten kennen en weten wat de p- waarde betekent. Deze kennis komt ook van pas voor onderzoekers op vele andere gebieden.

Heb je ooit Excel gebruikt om de p- waarde van een statistisch model te berekenen? Welke methode heb je gebruikt? Heeft u liever een andere manier om het te berekenen? Laat het ons weten in de comments.

Hoe p-waarde in Excel te berekenen