良いデータと悪いデータ

今月の議論は『なぜ競馬に必勝法がないのか』のつもりでいるのだが、反響ゼロですので一度締め括ろうと思う。
Googleで「天皇」を検索すると273万件、話題の「女系天皇」で絞って30万7千件、「皇位継承問題」で13万7千件であった(私の記事は106件目に拾われているぞ)。

ところがGoogleで「競馬」を検索すると366万件ヒットする。「競馬必勝法」で絞り込むと343万件(ほとんど違わない! 私の記事は大海に沈んで見つからない! )。「競馬 必勝法 会員 OR メールマガジン OR 会社」で調べると、なんと22万5千件も残る。競馬必勝法サイトの7割はどうやら情報提供の営利会社がつくったサイトらしい。いっそのことズバリ「競馬に必勝法はない」で検索してみる。39件ヒット。ところが私の記事が見つからないではないか。お題どおりの主張をされている人はお一人見つかったがhttp://oota56-matsui55.cocolog-nifty.com/keibajyouhou/(早速TBしておこうっと)、あとは次のようなものばっかり。

「競馬に必勝法はない」と言われてきましたが、実はあったんです。 一部の人にしか知られていない法則が!! この法則を見つけてから競馬は「こんなに簡単に当たる」「こんなにもうかる」と非常識な事の連続です。 当社もこの法則を取り入れてから対 ...

どうにもあきらめきれないので、google:競馬 控除率でクグルと27300件。何と私の記事が上位9件目にでている(が、こんな検索はふつうしないよな)。

そこで競馬必勝法と皇位継承について無理矢理比較分析してみました

類似点
あまり職場でするような話題ではない皇位継承が話題にしにくいのはタブーとされる「政治と宗教」(誰も本音を語ろうとしない)の両方にからんでいるからだが、一番のネックになっているのは「皇室のことをどのような敬語を使って話題にしてよいのか、職場での雰囲気がつかめない」ことにある。一方、競馬必勝法となると、競馬をやらない人の関心を引き付けることができないし、競馬好きの相手には「理屈っぽい野郎」だの、「小うるさいオヤジが」と嫌われてしまうだけだ。
相違点
皇位継承の話題は匿名でなら意見交換したいという人が多いのに対して、競馬好きのサイトは皆、自分の世界に入っているようでTBするにも気が引けてしまうところがある。大概は、自分の予想を公開して悦に浸っている。的中したときの喜びが倍加するからだろう(外れることのほうが多いはずだが、外れた馬券は少なめに、当てた馬券は多めに買っていたことに自己合理化できなくもない)。

結局これまで競馬関係でTBしたのは総合サイト競馬ブログ 人気ブログランキングとブログ検索 - にほんブログ村のみであった。また、ここがスゴイのだ。トラックバックセンターというコーナーが用意してあって、競馬に関する一般記事のジャンルだけでTBが5000件もある。自己顕示欲が強く、自分の記事を見て欲しい人が集合していて、他人の記事など誰も見ていないかのようだ。


懲りずに競馬ネタを1つ。

馬体重
これを重要視すべきは次の一事のみである。
出走馬の馬体重の平均より軽い馬同士で1.2着する確率は理論上は25%あるが、過去データは8%を切っている。軽―軽で決まるレースより、重―重で決まるレースが5倍も多い。したがって、買い目に軽―軽のペアがあれば迷わず切るというテクニックに用いることができる。

これは悪いデータの実践例である。なぜなら「比較的重量のある馬のほうが軽量馬より連対率が高いらしい」ということしかいっていない。この傾向は過去の成績にも現れているだろうから(軽量馬の成績が悪いはずだから)その点もオッズに織り込まれている可能性がある。したがって、重―重の組み合わせを全部買った場合の回収率と軽―軽の組み合わせを全部買った場合の回収率を比較して有意差が出たなら良いデータである。
その場合でも回収率が100%を超えることはないだろうから、他の有意なデータと併用することによって、どこまで回収率をあげることができるか、という話になる。競馬必勝法の研究は、なかなか険しく、どうやら元日冒頭に引用した言葉の呪縛から抜け出しそうもない

数学の歴史を見ると、角の三等分にせよ、平行線の公理の証明にせよ、5次方程式の代数的解法にせよ、何百年以上も研究されて解けなかった難問は、すべて最後には「不可能」であることが証明されて、けりがついている。
……世界中の専門家がよってたかって研究してもできない難問はいずれ不可能であることが証明されてケリがつく、と考えるほうが自然かもしれない。
改訂新版 暗号の数理―作り方と解読の原理 (ブルーバックス)』( 一松信 講談社ブルーバックス


私の記事タイトルは『なぜ競馬に必勝法ないのか』なのに対して、検索したのは「競馬に必勝法ない」だから1字違いでした。google:競馬に必勝法で検索しなおしたら私の記事がトップに! (が、こんな検索はふつうしないよな)。