Googleスプレッドシートでp値を計算する方法
p 値は、統計において最も重要な概念の 1 つです。研究プロジェクトに取り組むとき、これは科学者が 2 つのデータ セットの統計的有意性を見つけるためによく使用する出力データです。
しかし、Google スプレッドシートで p 値を計算するにはどうすればよいでしょうか?
この記事では、このトピックについて知っておくべきことをすべて説明します。この記事を最後まで読むと、p 値を計算して結果を簡単に確認できるようになります。
P値とは何ですか?
p 値は、特定の仮説が正しいかどうかを判断するために使用されます。基本的に、科学者は、データが相関していない場合に通常の期待される結果を表す値または値の範囲を選択します。データセットの p 値を計算すると、これらの結果にどれだけ近いかがわかります。
期待される結果を表す定数は、有意水準と呼ばれます。この数値は先行研究に基づいて選択できますが、通常は 0.05 に設定されます。
計算された p 値が有意水準を大幅に下回る場合、期待される結果は統計的に有意です。p 値が低いほど、データが何らかの相関関係を示している可能性が高くなります。
簡単なまとめ
Google スプレッドシートや数式を初めて使用する場合でも、理解しやすいように詳しく説明します。
関数は、一連の数値からどのデータを抽出するかを Google スプレッドシートに指示する単純な数式です。
P 値 (一連の数値が統計的に有意かどうか) を見つけるには、T 検定関数を使用します。結果が以下の場合。05、データは統計的に有意です。それより高い場合。05、さらにデータが必要です。
計算の不備により誤った結果が得られるリスクを回避するには、Google スプレッドシートなどのツールを使用するのが最善です。p 値は非常に重要であるため、開発者はそれを直接計算する関数を組み込みました。次のセクションでは、その方法を説明します。
T-Test 関数にデータを入力して結果を取得する方法は次のとおりです。
- 数式を入力したいボックスをクリックします。
- 上部にある「挿入」をクリックします。次に、「関数」と「統計」を選択します。次に、クリックしてT.Test 関数を挿入します。
T-Test 関数を挿入したので、データを入力する方法は次のとおりです。
最初の列と行のセットをリストします。
- 最初のセットを列番号 + 行番号として入力します。
- 最初のセットの後にカンマを入れます。
- この例では、A2:A7 のようになります。
次に、列と行の 2 番目のセットをリストします。
- 2 番目のセットを列番号 + 行番号として入力します。
- 2 番目のセットの後にカンマを入れます。
- この例では、B2:B7 になります。
Distribution Tails について Google に伝えてください:
- 数字の 1 は、1 つのディストリビューション テールを使用していることを意味します。
- 数字の 2 は、2 つのディストリビューション テールを使用していることを意味します。
- 1 または 2 の後にカンマを入力します。
最後の数値として 1、2、または 3 を入力します。
- 1 はペアテストのパラメータです。
- 2 は等しい 2 サンプル検定です。
- 3 は不等な 2 サンプル検定です。
- 1、2、または 3 の後にカンマを含めます。
関数の仕組みが理解できたので、データセットが 0.5 より大きいか小さいかを見てみましょう。
Google スプレッドシートでの p 値の計算
これを説明する最良の方法は、例に従うことです。すでに既存のテーブルがある場合は、次のチュートリアルで学んだことをそのまま適用してください。
まずは 2 つのデータセットを作成します。その後、作成したデータセットを比較して、統計的に有意性があるかどうかを確認します。
パーソナル トレーナーのデータを調べる必要があるとします。パーソナル トレーナーは、腕立て伏せと懸垂の進行状況に関するクライアントの数値を提供してくれたので、それを Google スプレッドシートに入力しました。
このテーブルは非常に基本的なものですが、この記事の目的には役立ちます。
これら 2 つのデータ セットを比較するには、Google スプレッドシートの T-TEST 関数を使用する必要があります。
この関数の構文は TTEST(array1,array2,tails,type) のようになりますが、構文 T.TEST(array1,array2,tails,type) を使用することもできます。両方とも同じ関数を参照します。
Array1 は最初のデータ セットです。この場合、それは Pushups 列全体になります (もちろん、列名は除きます)。
Array2 は 2 番目のデータ セットであり、[プルアップ] 列の下にあるすべてのものです。
尾部は、分布に使用される尾部の数を表します。ここでの選択肢は 2 つだけです。
1 – 片側分布
2 – 両側分布
Type は、1 (対応のある T-TEST)、2 (2 サンプルの等分散 T-Test)、または 3 (2 サンプルの不等分散 T-Test) のいずれかの整数値を表します。
次の手順に従って、p 検定の例を実行します。
- 選択した列に TTEST という名前を付け、この関数の結果をその隣の列に表示します。
- p 値を表示する空の列をクリックし、必要な式を入力します。
- 次の式を入力します: =TTEST(A2:A7,B2:B7,1,3)。ご覧のとおり、A2:A7 は最初の列の開始点と終了点を表します。最初の位置 (A2) にカーソルを置いて列の一番下までドラッグするだけで、Google スプレッドシートが数式を自動的に更新します。
- 数式にカンマを追加し、2 番目の列にも同じことを行います。
塗りつぶされた列が強調表示されることに注目してください。 - 末尾を入力し、引数を (カンマで区切って) 入力し、Enter キーを押します。
注: 詳細については、前のセクションを参照してください。
結果は、数式を入力した列に表示されます。
一般的なエラー メッセージ
TTEST 式の入力を間違えた場合は、おそらく次のいずれかのエラー メッセージが表示されたことがあるでしょう。
- #N/A – 2 つのデータセットの長さが異なる場合に表示されます。
- #NUM – 入力された tails 引数が 1 または 2 に等しくない場合に表示されます。type 引数が 1、2、または 3 に等しくない場合にも表示されます。
- #価値!– 末尾または型引数に数値以外の値を入力した場合に表示されます。
Google スプレッドシートを使用すると、データの計算がかつてないほど簡単になります
うまくいけば、もう 1 つの Google スプレッドシート関数があなたの武器庫に追加されました。このオンライン ツールの可能性と機能について学ぶと、たとえ統計学者でなくても、データ分析がより上手になるでしょう。
p 値の計算に使用する別の方法はありますか? 以下のコメント欄でお気軽にそれについて教えてください。
コメントを残す