ポアソン分布
ポアソン分布は、一定の時間や空間において、ある事象が発生する回数を表現する確率分布である。フランスの数学者シメオン・ドニ・ポアソンによって導入されたもので、主に希少な事象の発生頻度をモデル化する際に使用される。ポアソン分布は、一定の時間・空間における平均発生回数λ(ラムダ)が分かっている場合に、そのλを基にある期間内でk回の事象が発生する確率を求める際に適用される。例えば、交通事故の発生数、工場の機械故障数、カスタマーサポートへの問い合わせ件数など、頻度が低くランダムな事象に適している。
ポアソン分布の定義
ポアソン分布は、確率変数k(非負整数)が平均λの下で観測される回数の確率を表す。具体的には、確率質量関数(PMF)は次のように定義される。ここで、λは一定の期間内での平均発生回数、kは観測される事象の回数、eは自然対数の底(約2.718)である。この公式を用いることで、λが既知であれば、ある特定の期間に事象がk回発生する確率を計算することが可能である。
ポアソン分布の例
ポアソン分布について、平均発生回数?=5の場合の確率分布を示しています。横軸は「Number of Events (k)」で、事象の発生回数、縦軸は「Probability P(X = k)」で、その発生回数が起こる確率を示しています。
ポアソン分布の特徴
ポアソン分布の特徴として、λが大きくなるほど、分布が正規分布に近づく性質がある。また、λが小さい場合は、0に近い値で極端に偏った分布となり、事象の発生回数が非常に低いことを示す。平均と分散が共にλであるため、λが小さいときには、分散が小さく事象の発生がほとんど見られないが、λが大きくなるにつれて発生回数のばらつきも大きくなる。
ポアソン分布と二項分布との違い
ポアソン分布は二項分布と関連が深いが、異なる点も多い。二項分布は、固定された試行回数nと成功確率pに基づく分布であるが、ポポアソン分布nが非常に大きくpが非常に小さい(つまり、事象が稀である)場合の近似として使われる。また、ポアソン分布はガウス分布(正規分布)のように連続的な分布ではなく、離散的な分布であるため、個々の事象が離散的にカウントされるデータに適している。
ポアソン分布の条件
ポアソン分布が適用できる条件は、次の3つである。1つ目は、観測期間中に事象が無限に発生する可能性があることである。2つ目は、任意の短い時間間隔で事象の発生確率が一定であり、他の間隔とは独立していること。3つ目は、非常に短い時間間隔においては、同時に複数の事象が発生する確率が極めて低いことである。これらの条件を満たす場合に、ポアソン分布が適用できる。
ポアソン分布の応用例
ポアソン分布はさまざまな分野で応用されている。例えば、交通事故の発生回数、ウェブサイトへのアクセス数、電話センターへの1時間あたりの問い合わせ件数、製造ラインにおける不良品の発生数など、ランダムな事象の発生頻度をモデリングする際に用いられる。また、保険業界では、自然災害や病気の発生頻度を予測するためのリスク評価に利用されることも多い。
ポアソン分布の例
あるコールセンターで1分間に平均5件の問い合わせがあるとする。このとき、1分間に問い合わせが3件発生する確率をポアソン分布を使って求めることができる。この場合、平均λは5であり、kは3となる。これをポアソン分布の公式に代入すると、1分間に問い合わせが3件発生する確率が計算できる。こうした例は、多くの実社会の問題でポアソン分布が適用できる典型例である。
ポアソン分布の限界
ポアソン分布は、事象が独立していると仮定するため、事象同士に相関がある場合には適用できない。また、事象の発生確率が時間や空間によって変動する場合にはポアソン分布が適していない。そのため、実際のデータ分析では、ポアソン分布が適用できるかどうかを慎重に検討する必要がある。