読者です 読者をやめる 読者になる 読者になる

理系男子の独り善がり

仕事や生活に役立ちそうな(実際に役立つかは別として)数学・物理ネタをつらつらと書いていこうと思ってます.

散布図と相関の使い方~たとえば,こんなのどうでしょう?~

Math

先日,ゴルフコンペに参加してきました.グリーンの芝がベクトル場のように矢印で見えたり,物理原理をうまく使えられれば,上達するのかもしれませんが,それよりも自分の感覚(くせ)の方が勝ってしまうので,うまくなれません(苦笑).しかし,そのような人を救済してくれるルールがあります.

 

ぺリア方式

ゴルフをしない方には聞きなれない言葉ですね.もう少し聞きなれた言い方をすると「18ホールのうち,いくつかのホールでハンディキャップを設ける」というものです.

  1. ハンディキャップ(HC)を与えると決められたホールのスコア合計(プレイヤーが実際に打った打数)から
  2. 計算式を用いてHCを計算し,
  3. 実際のトータルスコア(グロス)からHCを引いたものをスコア(ネット)とする.

というものです.ぺリア方式も,ダブルぺリアや新ぺリアといったいろいろな種類があったり,ハンディキャップの上限のあり・なしがあったりします.

プレイヤーはどのホールにHCが与えられているかは知らずにプレーをします.集計後にびっくりということもあるわけです.

 

実際の総打数(グロス)で勝負すると,上手い人しか優勝できないので,競い合えるようにハンディキャップを与えるというのが目的です.言わば,上手い人にはHCは少なく,上手くない人にはHCは多くなるという仕組みです.

 

グロスとHCの相関

先日のコンペで結果を一覧でもらったとき,「これって上で書いたようなHCの与えられ方をしているのかな?」と気になりました.そこで,Excelを使って,散布図と回帰直線(近似直線)を描いてみました.このとき,HCの上限はないルールでした.

f:id:miwotukusi:20140907230846p:plain

 

赤い数字は最終順位です(同じスコアのプレイヤーもいます,数字が重なっているところは大目に見てください).散布図を見ても明らかですが,相関係数は約0.958と強い相関があることがわかります.ということは,スコアに応じたHCが与えられていたということがわかります.

 

グラフの見方をもうちょっと

たとえば,回帰直線よりも上にあるもの・下にあるものを見てみると,上位10位のうち9人が回帰直線よりも上にあります.HCが効果的に働いたプレイヤーが順位を上げたということになります.さらに,回帰直線よりも大きく上にある1位と3位のプレイヤーはグロスの順位(それぞれ,8位と20位)よりも大きく順位を上げています.

ほかにも,似たようなグロス(横軸の値)で上にある方が順位がよいこともわかると思います.

最後に,以前のネタにも書いていますが,グラフの横軸と縦軸の比率が違っています.上のように,定性的に読み取るには十分なグラフですが,定量的に見る場合には注意(これらの注意点を前提として頭に入れておくこと)が必要です.

 

散布図と相関関係というと,センタ試験の選択問題ぐらいでしか見ることがないと思います.今回の例は,どちらも計算式で結びついているスコア同士を考えたので,相関が強く出て当然といえば当然ということもできます.最近では,直接相関が見えないようなところから関係を見つけてくる(データマイニング)ことから,マーケット戦略を立てるという手法もあります.もし気になったら,細かい計算は表計算ソフトでやってくれるので,今回のように試してみるのもいい勉強になると思います.