Contents
信頼性とは?
リハビリテーション分野で頻繁に用いられる評価の信頼性についてまず説明してみる。
今でも統計は嫌いというか得意ではないですが、研究を行う上で避けては通れないので、とりあえず頑張ります。
勉強してみて思ったことは、
①あくまで少数から全体を推し量っていること。
②方法論が非常に大切。
統計学のその他の記事
信頼性をもたない測定・評価方法では妥当性はない。
簡単に言うと、1回目と2回目の検査結果がものすごく変わる評価では、その結果は信頼できない。
実際の所、信頼性が未確認なまま報告してある論文はリハビリ分野ではよく見る。
まあ、血液のように、1滴とれば何百種類の項目のデータが出てくるものとは違い、リハ分野では対象が人なのでバラツキはもちろんあるのは仕方ないのだが、極力、バラツキを少なくする努力はしないといけないだろう。
で、どんな努力をしなければいけないかと言うと
①検者内信頼性 ICC(1,1)と②検者間信頼性 ICC(2,1)
については必ず検討しておいた方が良い。
①は、本人の問題。何回か計測しても同じ値なのか?
②は、測定者の問題。誰が評価しても同じ値なのか?
ちなみに信頼性の統計にはICCとカッパ係数の2つがあって、僕の覚え方としては、連続データ(間隔・比率尺度)はICC、順序、名義尺度はカッパ係数と理解している。
ICC、カッパ係数とも0~1の範囲をとり、相関係数のように1に近づけば信頼性は高いといえる。
今のリハ分野での信頼性の値は0.7~0.8以上であれば信頼性は高いと考えてよい。
つまり1人の検者を1回測定したデータを使っても良いことになる。
ICC
K係数
信頼性の理論では、
検者内信頼性を高めるためには、複数回測定した平均を使うこと。
検者間信頼性を高めるには、複数の検者で測定した値を平均して使う。
よくある疑問
「計測は2回でいいのか?1回?3回?」
この疑問を解決してくれるのは、SB公式(スペアマン・ブラウンの公式)
例えば、ある測定法のICC(1, 1)が0.7とする。0.9まで信頼性を高めたい場合、
公式に当てはめると、
つまり4回繰り返して、平均すれば信頼性は高まるということだ。
後、カテゴリーで表す評価でたまにあるのだが、重み付きk係数なんて言葉がまれに論文に書いてあるが、完全一致率してなくても1段階のズレを許容する場合があって、例えば、1段階のズレを「半分の一致」として、重み0.5として、完全一致よりも、k係数を高くすることもできる。
注意としては、重み付きk係数を使用した場合は、0.75以上じゃないと、Excellentにならないこと。
また、ICCを解釈する上での大きな問題は信頼性係数の範囲制約性である。
例えば、握力を測定する時、握力の低いものから高いものまで集めれば、ICCは高くなり、
逆に低いものだけしか集めないとICCは低くなってしまう。
この差を判断するために、標準誤差(SEM)を参考にするとよいみたい。
誤差の標準偏差と考えてもらっていいでしょう。
調べる限りでは、数値の基準はなさそう。
0に近い方がいいのかな。
http://www.oak.dti.ne.jp/~xkana/psycho/stat/stat_17/index.html
表のように、一見似た結果でも、ICC、SEMともにこんなにも数値は違う。
つまり、ICCの値だけみるのは、危険。
しっかり、生データを散布図などで確認したい。
統計ソフトでも、カッパ係数については3回以上の繰り返し測定に対する検者内信頼性や3名以上の検者間信頼性は求められない。
しかしフリーソフトRはこれを無料で解決してくれるらしい。
http://o-server.main.jp/r/about.html
まとめ
数値に騙されないためにも散布図、クロス表を上手く利用するべき。
統計に関するオススメ本
信頼性、妥当性に関してはコレ。
ロジスティックに関してはコレ。
分かりやすい本。近藤教授に教えてもらった。
全体的にはコレ。(*重回帰分析の記載はない)
個人的に面白かったのがコレ。
統計をマンガで知りたいならコレ。
基礎は学べる。レビューは高い。1時間あれば読める。
最後に三浦知良の「やめないよ」
サッカーしらなくても、社会人として必要なこと一杯書いてあります。やっぱりかっこいい。「僕は学び続ける人間でいたい」の文章に鳥肌。