TAG

統計

  • 2024年7月23日
  • 2024年7月22日

【Polars】Pandasに代わるPythonの次世代表計算ライブラリの基本操作を解説

Polars はPythonの表計算ライブラリの1つです。Pythonの表計算ライブラリといえばPandasが広く知られており、使用されている方も多いと思います。ですが、パフォーマンスの面ではPolarsのほうが優れているという検証結果がいくつもあります。 今回は、Polarsに馴染みの無い方、これ […]

  • 2022年10月25日
  • 2023年3月2日

【Pandas】移動平均を求める -rolling()

時系列データの分析をする際に「移動平均」という言葉を聞いたことがあると思います。 今回は移動平均とはなにかということと、Pandasで移動平均の求め方について取り上げます。 移動平均とは 株価や気温など、時間の推移によって細かく値が変化するデータは、その変動の細かさ故に全体の傾向を掴むのが難しいケー […]

  • 2022年7月17日
  • 2022年7月16日

【統計】Pythonでポアソン分布を用いた検定をやってみる

今回はポアソン分布を用いた検定をやってみます。ポアソン分布については以下をご覧ください。 ポアソン分布を用いた検定 お題 1日に平均15人来店する中華料理屋があります。来客数を増やしたい店主は、オリジナルのメニューを考案しSNSで宣伝活動をしました。その結果、1か月で1日平均25人まで来客数が増えま […]

  • 2022年7月12日
  • 2023年3月4日

【統計】Pythonで二項分布を用いた検定をやってみる

以前に二項分布の概要をまとめ、その分布をPythonで可視化してみました。 二項分布を用いて検定を行うこともできます。二項検定は結果が2つに分類されるデータの比率が期待される比率に対して偏っているかを調べる際に用いる検定です。 今回は二項分布を用いた検定の流れを把握し、Pythonで検定を行ってみた […]

  • 2022年7月8日
  • 2023年5月15日

【統計】Pythonで幾何分布を理解する

これまでに二項分布、ポアソン分布について紹介しましたが、確率分布には幾何分布という分布も存在します。今回は幾何分布がどういう分布なのかということを確認し、Pythonで幾何分布を描画してイメージを掴んでいきたいと思います。 本記事では、ポアソン分布をどのように求めるかではなく、ポアソンとはどういうも […]

  • 2022年7月5日
  • 2023年3月4日

【統計】Pythonでポアソン分布を理解する

統計では以前に紹介した二項分布のほかに、ポアソン分布というのも出てきます。ポアソン分布も二項分布同様確率分布のお話ですが、どのような分布なのかというところを確認していこうと思います。また、分布のイメージを掴むためにもPythonで分布の描画もしていきます。 本記事では、ポアソン分布をどのように求める […]

  • 2022年6月29日
  • 2023年3月4日

【統計】Pythonで二項分布を理解する

確率分布の1つに二項分布があります。今回は二項分布がどんなものなのかということを、Pythonでグラフを描いて、実際の分布を確認しながら見ていこうと思います。 二項分布とは ベルヌーイ試行 「成功か失敗か」「表か裏か」のように、2種類の結果しか得られないような試行をベルヌーイ試行と呼びます。ベルヌー […]

  • 2022年3月31日
  • 2023年3月4日

【統計】Pythonで母平均の区間推定をやってみる

多くの場合、ある集団の真の平均(母平均)は闇に包まれています。 たとえば、世界中の全ての男性の平均身長を正確に割り出すには、全ての男性の身長を測定しなければなりません。そんなん無理です。 こういった場合には、一部のサンプルからだいたいこれくらいの範囲に平均が収まるであろうという推測をします。それが母 […]

  • 2022年3月4日
  • 2023年3月4日

【統計】分布の尖度と歪度とは?を図解

データの分布をみるときに、尖度と歪度というキーワードを聞いたことがあると思います。これらは分布の特徴を表す指標で、これらの情報から分布の形が数値的に見えてきます。 今回は尖度と歪度の意味と数値の見方について解説していきます。 前提 尖度と歪度は正規分布を基準とした値です。そのため、正規分布では尖度も […]

  • 2022年3月1日
  • 2023年3月4日

【統計】Pythonでt検定をやってみる

前回はt検定について、中身と流れをまとめました。 https://www.learning-nao.com/?p=2589 今回は、そのt検定をPythonでやってみようと思います。 使用するデータ 今回は定番のアイリスデータセットを使っていきます。 さらに種類を追加します。iris.targetに […]