ケンドールの順位相関係数(けんどーるのじゅんいそうかんけいすう、ケンドールのタウ係数、英: Kendall rank correlation coefficient)は、順位(Ranking)間の相関計測に用いられ、相関の強さを表す。言い換えれば、それは複数のデータ間(cross tabulations)の関連性(association)の強さを表す。1938年にモーリス・ケンドール(Maurice Kendall)によって開発された。
順位相関を計測する別の方法としてはスピアマンの順位相関係数があるが、両者はほぼ同じ傾向を示す。
定義[編集]
順位データ x = (x1, …, xn) と y = (y1, …, yn) とのケンドールの順位相関係数 τ は次で定義される。
![{\displaystyle {\begin{aligned}\tau &={\frac {K-L}{\binom {n}{2}}}\\K&=\#\left\{\,\{i,j\}\in {\binom {[n]}{2}}\mid x_{i}\lessgtr x_{j},\ y_{i}\lessgtr y_{j}\,\right\}\\L&=\#\left\{\,\{i,j\}\in {\binom {[n]}{2}}\mid \neg (x_{i}\lessgtr x_{j},\ y_{i}\lessgtr y_{j})\,\right\}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0be99ffecf19a1243e1f9ecf03b0c79d1d36e106)
ここで K(または L )は n 項目から2項目を選んだときに順位関係が一致(または不一致)する組の数である。τ の分母は二項係数である。# は元の個数(濃度)を表す。また
であり、集合 X と自然数 k に対して
は X の k 個の元からなる部分集合全体を表す。
は < または > を表し(複号同順)、
は否定を表す。
特性[編集]
ケンドールの順位相関係数 τ は以下の特性を持つ。
- 順位が完全に一致している(すなわち L = 0)ならば τ = +1 である。
- 順位が完全に一致していない(すなわち K = 0)ならば τ = −1 である。
- 他のすべての場合には係数の値は−1と+1の間にあり、値の増加は相関の増大を意味する。順位が完全に独立しているなら、係数の値は0である。
参考文献[編集]
- 脇本和昌『身近なデータによる統計解析入門』森北出版、1973年。ISBN 4627090307。http://ebsa.ism.ac.jp/ebooks/ebook/1321。
- Abdi, H. (2007) Kendall rank correlation. In N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage. [3]
- Kendall, M. (1948) Rank Correlation Methods, Charles Griffin & Company Limited
- Kendall, M. (1938) "A New Measure of Rank Correlation", Biometrika, 30, 81-89.
脚注[編集]
関連項目[編集]
- ケンドールτ距離(英語版)
- スピアマンの順位相関係数
- 相関係数
外部リンク[編集]