世の中の憂うつの総量を計測する (original) (raw)

この広告は、90日以上更新していないブログに表示しています。

f:id:fish2000:20210425122824p:plain

私はもともと株式投資にあまり興味がなかった。独身時代は給料は全て普通預金に貯めておくという、やり方だった。当時は定期預金でも数パーセントの利子がついたので、それで十分と思っていた。しかしバブルが崩壊すると定期預金の利率はほぼ0になった。百万円を一年預けても利子は千円程度にしかならなくなってしまった。また結婚して子供が学校に通い始めると、養育費でお金がかかるようになった。そこで、株式投資をしてみるか、ということになった。

株式投資をやるにあたって、投資に関する本をいくつか読んだ。「金持ち父さんシリーズ」、「バフェットの銘柄選択術」、「マンキュー入門経済学」、など数十冊は読んだと思う。そうやって株式投資の勉強もしてみたのだが、残念ながら買った株は下がることが多かった。結局数年で株は全て売却してしまった。現在は株式投資は全くやっていない。

株式投資は止めてしまったが、経済学や金融工学について勉強するのは面白かった。特に、オプションやワラントといった金融商品には興味を持った。皆さんご存じのように、株式投資には未来の株価に連動した金融商品がある。未知なる将来の株価は誰もわからない。ではどうやって、将来の株価を想定した金融商品を作ることができるのか、興味を持った(こういった金融商品リスク管理は難しいので、私自身がオプション取引をしたことはない)。

オプションやワラントの仕組みについていろいろ調べるうちに、「ブラック–ショールズ方程式」や「伊藤のレンマ」といった説明にたどり着いた。数学的な説明はあまり理解できなかったが、「株価のオプションというのは、何らかの数理モデルを前提に、現実の株価のデータを使って計算される」ということぐらいのことは分かった。また世の中には、正規分布以外にも、べき分布のような複雑系のモデルが存在することも知った。さらに数理モデルが現実の株価のデータを反映していないことにより、ロングタームキャピタルマネジメントの破綻、といった問題が起きることも知った。

未来の株価やその確率がわかれば、大儲けができる。そういったこともあり、株価の変動や予測、分布や数理モデルに熱心に取り組む研究者や金融会社は多い。

一方、精神医療における病気の予後や分布や数理モデルに関する研究はあまり行われていない。うつ病の経過の数理モデルや、抑うつ症状がどんな数理モデルに従うのか調べたけ研究は聞いたことがない。精神医学において、データや数理モデルを利用した研究がもう少し行われてもよいのではないかと思った。臨床家が、うつ病の経過の数理モデルを持たずに、うつ病の治療を行っているのは、もったいない気がした。

そんなわけで、京都大学の古川教授に、「うつ病の経過の数理モデルのアイデアがあるんですど、うつ病の経過研究のデータを利用させてくれませんか?」と相談してみた。「いいよ」ということになり、本研究を始めることになった。

株式投資の本を乱読したおかげで、研究テーマを思いつくこともある、という話でした。

抑うつ評価尺度とは、抑うつ症状を評価するための物指しである。抑うつ評価尺度は、いくつかのうつ症状に関する質問項目と、その答えの選択肢からなる。そして選択肢の答えには予めスコアが割り当てられている(項目スコア)。そして全ての項目スコアの和(総スコア)を、抑うつのレベルの指標として扱う。

代表的な抑うつ評価尺度には、CES-D(The Center for Epidemiologic Studies Depression Scale)、PHQ-9(Patient Health Questionnaire), K6(Kessler psychological Distress Scale)、HRDSハミルトン抑うつ評価尺度(Hamilton Rating Scale for Depression)、といったものがある。いずれも米国で開発されたが、その後様々な言語に翻訳され、世界中で使われている。抑うつ評価尺度は、精神科の診療のみならず、抗うつ薬臨床試験脳科学の基礎研究などに幅広く利用されている。

項目スコアは、尺度の開発者によって恣意的に決められた数値である。したがって項目スコアには等間隔性が担保されていない(順序尺度)。理数系の研究者にとっては、順序尺度の和がなぜ抑うつのレベルを反映するのか、疑問を感じる方もいると思う。この疑問は重要で、Stevensを始めとして、歴史的に論じられてきた経緯がある。 *1

一方、一般の臨床家や研究者にとって、抑うつ尺度の総スコアを抑うつレベルとみなすことは業界の常識に近い。昔から行われてきた慣習なので、疑問を持つ人はまずいない。しかし、抑うつ尺度の総スコアが本当に抑うつのレベルを反映しているかどうか(線形の関係を持つかどうか)は、根源的でかつ重要な問題と思われる。

この問題を考えるにあたって、抑うつスコアの分布の形は重要な意味を持つ。その説明はかなり長くなるし、難しい。詳しくは 正式サイトを読んでいただければと思う。

*1:Stevens, S. S. On the theory of scales of measurement. Science, (1946) 103, 677–680.

憂うつな気分を経験したことがない人はいないと思う。人間は、何か辛いことが起きた時、あるいは起きることが予測された時、憂うつな気分になる。憂うつの程度は軽いものから重いものまで様々である。倒産の危機にある自営業者の抑うつのレベルはかなり重いだろう。定期テストで悪い成績を取った高校生の抑うつのレベルは比較的軽いと思う。

f:id:fish2000:20210423191829p:plain
精神科医は、個人の抑うつのレベルを把握する必要がある。ではどうやって個人の抑うつの程度を把握するかと言うと、“抑うつ症状”(depressive symptoms)を評価することによって、憂うつのレベルを判断する。抑うつ症状とは、人が抑うつ的になった時に出現する、様々な症状のことを指す。抑うつ気分、意欲の低下、自殺念慮といった心理面に現れる症状から、不眠、食欲不振、疲労感といった身体面に現れるものまで様々な症状がある。

これまでの経験則や臨床研究から、憂うつな気分になるほど、抑うつ症状が重くなることわかっている。重い憂うつな気分に苛まれると、ほとんどの人は夜は眠れなくなるし、何事にも億劫になる。こういった経験則から、うつ症状は抑うつのレベルを表現するものと認識されるようになった。実際、現在の精神医学では、抑うつのレベルとは、すなわち抑うつ症状のレベルを意味する。そして生活に支障を来たすほど抑うつ症状が悪化した状態をうつ病と診断する。

精神科医臨床心理士が、診察の度に「眠れますが?」「何か気晴らしがありますか?」と同じような質問をするのは、患者の抑うつの程度を把握するためである。

注意してほしいのは、個人の抑うつのレベルは、状況の深刻さではなく、抑うつ症状の程度によって決まるということである。一般的に状況が深刻になればなるほど、抑うつ症状は重くなる傾向がある。しかし個人差も存在する。非常に深刻な状況でも、前向きな気持ちを維持できる人もいれば、客観的にはそこまで深刻な状況に見えなくても、重い抑うつ症状を呈する人もいる。

体温を測るために”体温計”があるように、抑うつのレベルを客観的に測定できる、“抑うつ計”のようなものがあれば便利でと思う。しかし、残念ながらそのようなテクノロジーはまだ開発されていない。そういったこともあり、現行のうつ病の診断基準は、いずれも抑うつ症状の項目のみで構成されている。画像検査や血液検査といった計測結果は含まれていない。もちろんうつ病の重症度を反映する客観的な指標を見つけようと、世界中で熱心に研究が行われているのだが。

世の中には様々な抑うつのレベルの人がいる。全く抑うつ感のない人から、重い抑うつ状態の人まで様々である。そして、こういった幅広いレベルの抑うつを客観化するために、“抑うつ評価尺度(depression rating scale)”という評価尺度が用いられる。では抑うつ評価尺度とはどういうものなのか、次回で説明したい。

前回のブログで説明したように、抑うつ症状のスコアの分布は年齢に対して安定している。これはかなり不思議な現象である。前回のブログでも述べたが、一般的に年齢というのは生体に対して強い影響を持つのからだ。血圧、体重、運動能力、記憶力、と年齢の影響を受けない形質はない。しかし、例外的に抑うつ症状のスコアの分布は年齢に対して安定している。

抑うつの分布が年齢に対して安定するには、分布を安定させるなんらの仕組みが存在する可能性が高い。そういった仕組みがなければ、抑うつのスコアの分布は、他の生物学的指標のように、年齢とともに変化するはずである。

更に仮説を広げると、抑うつの分布が安定するための仕組みが存在するとしたら、抑うつの分布はなんらかの数理パターンを示す可能性がある。分布を安定させる力(仕組み)が存在するのなら、分布の形はその力の影響を受けて、なんらかの数理パターンを示すからである。

以上の仮説に基づき抑うつ総スコアの総スコアの分布を調べたところ、総スコアの分布は指数分布に近似することがわかった(図1)。*1

f:id:fish2000:20210419204234p:plain

図1 日米の一般人口における抑うつ総スコアの分布

図1A、B、Cは日米における抑うつ評価尺度の分布を示したものである。Aは日本で行われた保険福井動向調査(2000年)のCES-Dのデータ、Bは米国で行われたNHANES調査のPHQ-9の調査のデータ、CはNHIS調査のK6のデータを示したものである。いずれの分布も右肩下がりの分布を示している(CES-D、PHQ-9、K6というのは疫学研究で用いられる代表的な抑うつ評価尺度である)。社会における抑うつ評価尺度の分布は、正規分布のような対称性を示さす、右肩下がりの分布を示すのである。

このA,B,Cのグラフを方対数グラフ(y軸が方対数)に入力するとC,D,Eのようにほぼ直線を示した。y軸が方対数のグラフで線形を示すということは、いずれのグラフも指数分布に近似するということである。

なお図E,Fの矢印が示すように、抑うつスコア0の近傍では、指数分布から外れる傾向がある。この現象に関しては後で詳しく説明したい。

右肩下がりの分布を示すグラフには、べき分布や対数正規分布といった理論分布も存在するが、様々なモデルの適応の良さを比較しても、やはり指数分布が最も適していた。*2

ではなぜ抑うつ評価尺度の総スコアは指数分布に従うのだろうか?

一般的に分布の形はその分布が成立する仕組みによって決まる。例えば正規分布は独立した因子の影響が重なった現象(数学的には足し算)で成立する。例えば身長は、様々な遺伝子や環境要因の影響の総和によって決まる。その結果、身長は正規分布に従う。生体指標が正規分布に従うことが多いのは、生体指標は要因の総和によって決まることが多いからだろう。

指数分布と正規分布の形が異なるのは、その成立する仕組みが異なるからである。指数分布の仕組みとしては大きくわけて2つあり、一つはランダムな現象が時間的観察によって認められる。例えば、細菌の増殖や放射性物質の減衰やイベントの待ち時間などがある。指数分布と言えば、この時間軸に関連した指数分布が有名である(統計学の教科書では時間軸に関する指数分布しか説明されていない)。

しかし、時間軸とは関係ない指数分布が生じる仕組みがある。抑うつスコアの分布は、この非時間軸の指数分布に相当する。非時間軸の指数分布の成立条件としては、総量が安定した状態で、個々の交換が行われる時に、出現するといわれている。こういった条件を満たすと、エントロピー最大化の原理によって指数分布が成立する。*3

残念ながら非時間軸の指数分布はあまり知られていない。非時間軸の指数分布の代表的な例としては、空気中の分子のエネルギーの頻度がある(ボルツマン分布)。個人所得の分布も同じ原理で指数分布に従うと言われている。また人間の人間の一日の中での時間当たりの活動量も指数分布に従うという報告もある。*4

ほとんど病気や生体の指標は年齢の影響を強く受ける。しかし例外的に、抑うつスコアは年齢に対して安定している。この不思議な現象を理解してもらうには、抑うつスコアの分布が、年齢に応じてどう変化するかを見てもらうのが一番よいと思う。

まず、一般的な生理学的指標の例として、血圧の分布が年齢に応じてどう変化するか見て頂きたい。図1Aは日本人男性の収縮期血圧の30代と60代の分布の違いを示している。国民生活基礎調査のデータより作成したグラフである。

f:id:fish2000:20210418091818p:plain

図1Aは日本人男性の収縮期血圧の分布(国民生活基礎調査のデータ)図1BはPHQ-9スコアの年齢による分布 Tomitaka S, et al. Front. Psychiatry 2018 9:390.より

図1Aを見ると、30代と60代、いずれのグラフも対称的で正規分布のような釣り鐘型の形をしている。両者を比べると、60代の赤い収縮期血圧グラフは、30代の青いグラフに比べて、大きく右にシフトしているのがわかる。図1Aの点線は高血圧の基準の一つである収縮期血圧140mmHgを示しているが30代より60代の方が収縮期血圧140mmHgを超える割合が、明らかに多い。つまり30代より60代の方が、高血圧の患者が増加するということである。以上より、血圧の分布は年齢と共に大きく変化すると言ってよい。もちろん、中には60代になっても血圧が上昇しない個人もいる。しかし全体として見れば、血圧は年齢と共に大きく変化する。

では抑うつ評価尺度の総スコアの分布は年齢によってどう変化するのだろう?図1Bは米国政府が毎年行っている健康調査NHANESにおけるPHQ-9スコアの分布である(約1万5千人が対象)*1。PHQ-9とは世界で最も使われている抑うつ評価尺度である。PHQ-9の総スコアは0点から27点に分布するが、総スコア10点以上がうつ病スクリーニングのカットオフポイントである。図1Bの点線はカットオフポイントを示しているが、カットオフポイントを超えるとうつ病の可能性が高い(感度88%、特異度88%)。

図1Bは、30代、40代、50代、60代、それぞれのPHQ-9の総スコアの分布を示している。どのグラフも右肩下がりを示しているが、お互いのグラフがほぼ重なっており、区別するのが難しい。PHQ-9の総スコアの4つのグラフは、非常に似ていることがわかる。血圧では年齢による分布の変化が一目瞭然だった。一方PHQ-9の総スコアの分布は、年齢が変化してもほとんど変わらない。

なおPHQ-9の総スコアの分布がこれだけ安定していても、帰無仮説に基づく平均値の検定を行えば有意差は認められる。こういった数万人規模のデータの場合、サンプル数が非常に大きいので、平均値の有意差検定を行うと、わずかな違い(低い効果量)でも有意差が検出されるのである(ちなみに図1Bでは、PHQ-9スコアの平均は50代で最も高くなる)。しかし、このグラフ(図1B)の意味する一番のポイントは、抑うつの分布は年齢に対して安定しているということだろう。

血圧場合、年齢に応じて個人の血圧は変動する。その結果分布全体も変化する。一般的に、個が変化すれば、全体も変化するのが当たり前である。しかし抑うつの場合、そうはならない。個人の抑うつはストレス等により変化するが、分布自体は安定している。

ではどういった仕組みでこのような現象が起きるのだろうか?

*1:Tomitaka S, et al. Stability of the Distribution of Patient Health Questionnaire-9 Scores Against Age in the General Population: Data From the National Health and Nutrition Examination Survey. Front. Psychiatry 2018 9:390.

抑うつの分布の数理モデルに興味を持つようになったのは、うつ病のかかりやすい年齢について調べたのがきっかけである。うつ病の好発年齢ついて調べた結果わかったのは、これまで非常に多くの疫学研究が行われてきたが、これまでの調査結果があまり一致していないということである*1

ちなみに一般向けの成書や精神科の教科書ではこういった詳しい説明はなく、むしろ「うつ病は中高年を中心としてあらゆる年代において認められる病気である」といった曖昧な説明が書かれていることが多い。

うつ病で通院している患者を対象に調査を行った場合、日本では男性では40代から50代、女性だと40代から70代の方が多い*2 。しかし、うつ病と年齢との関係を調べるには、受診した患者の調査だけではなく、一般人口を対象とした大規模調査を行う必要がある。なぜならうつ病は高血圧や糖尿病と同じように受診率が低い病気だからである。受診率の低い病気の場合、通院していない患者の方が多いので、通院患者だけを対象に調査を行っても不十分なのである。

仮にある年代のうつ病の通院患者が最も多かったとしても、その年代の患者が多いのか、あるいはその年代の受診率が高いのか、区別できないからである。したがって、病気に対する年齢の影響を明らかにするには、一般社会を対象にし調査を行う必要があるのである。

これまで日本を含め様々な国で、抑うつ評価尺度を使った大規模な疫学調査が行われている。しかし、それらの結果を見ると、結果が一致しないのである*3。 ある調査では20代から50代にかけて抑うつスコアが上昇し、50代から70代にかけて減少していた。しかしある調査では、逆に20代から60代にかけて抑うつスコアが減少し、その後高齢になるにつれ上昇している。また一方で、若年成人の抑うつスコアが最も高く、年齢に応じて右肩下がりに減少するという報告もある。さらに、高齢になるほど抑うつスコアが増えるという報告もある。

さらにややこしいことに、毎年同じ方法で行われている大規模調査でさえ、年度によって結果が異なるのである。例えば米国で毎年行われているNHIS(National Health Interview Survey)の結果を調べると、抑うつスコア(K6)がピークとなる年齢は、年度によって様々である*4。実際、ある年にはうつ病の有病率は30代でピークとなり、その翌年には60代がピークとなる。調査の行われた年によって結果が異なるのである。ちなみに高血圧やアルツハイマー病の疫学調査において、年度によって血圧の高い年齢やアルツハイマー多い年齢が異なることはあり得ない。調査の行われる年度に関係なく、高齢になるほど高血圧やアルツハイマー病が多いことは一貫している。

ではなぜうつ病に限ってこんな不思議な現象が起きるのかと不思議に思った。前述したように、この疑問が本研究を始めたきっかけである。

その後調査を進めるうちに、次の二つのことが明らかになった。

①これまで行われた大規模調査の結果では、抑うつスコアとの年齢との関係は一貫しておらず、若年者に多い、中高年に多い、高齢者に多い、と調査によって結論は様々だった。

②いずれの調査結果でも一つだけ共通していることがあり、それは年齢による影響はそれほど大きくないということである。

仮に、抑うつスコアは年齢による変化(統計学でいうところの効果量)が少ないと考えると、年齢と抑うつスコアの関係を調べた研究結果が一致しにくいことを理解しやすい。抑うつスコアに影響を与えるのは年齢だけではない。性別、家族状況、経済状態、健康度といった様々な要因も影響を与える。抑うつスコアに対する年齢の影響が弱ければ、他の要因(性別、経済状態、健康度、等)の影響で年齢の影響が目立たなくなり、結果として年齢の影響を検出しにくくなる。シグナル(信号)が小さくて、ノイズ(雑音)が大きければ、シグナルを検出しにくいのと同じ理屈である。つまり、「抑うつスコアに対する年齢の影響は弱いので、抑うつスコアと年齢の関係を調べた研究結果は一致しにくいのだろう」という結論になった。

しかし、この結論で一件落着とはならなかった。なぜなら病因論から考えると、「抑うつスコアに対する年齢の影響が弱い」という説明は、新たな疑問を生むからである。

前述したように、ほとんどの病気では、病気の好発年齢は確立している。その主な理由は、ほとんどの病気は、環境の影響を強く受けるからである。多くの病気は環境の影響を強く受けるので、結果的に年齢の影響を強く受けることになる。

年齢とは、環境の蓄積を意味する。もし年齢の影響を受けない病気が存在するとしたら、環境の影響を受けにくい病気ということになると思う。しかしこの説明は、これまで知られていたうつ病に関する知見と矛盾する。これまでの研究から、うつ病は環境(ストレス等)の影響の大きい病気であることは知られている。実際、うつ病に関する最も有名な学説は“ストレス仮説”である(ストレスは環境因に含まれる)。つまり、うつ病のストレス仮説と、抑うつスコアが年齢によってあまり変化しないという事実は、矛盾するのである。

しかし、調べた限りにおいて、この矛盾について論じている論文は見つからなかった(そもそも、抑うつスコアと年齢の関係が確立していないことを認識している精神科医や研究者は少ない)。しかし個人的には、なぜ抑うつスコアが年齢の影響をあまり受けないのか、不思議だった。そういったことがきっかけで、抑うつスコアの分布の年齢による変化について研究するようになった。

今週下記の論文が掲載されました。パチパチ。

Tomitaka, Shinichiro, and Toshiaki A. Furukawa. "Mathematical pattern of Kessler psychological distress distribution in the general population of the US and Japan." BMC psychiatry 21.1 (2021): 1-9.

どんな内容かというと、日本と米国の一般人口におけるストレス評価尺度K6の分布を調べたのですが、いずれのデータでも総スコアの分布は指数分布に従うということです。

国や地域に関係なく、抑うつの分布は同じ数理パターンの分布を示すということです。抑うつ症状が形成されるメカニズムはどの国でも同じなので、当然分布の数理パターンも同じ指数分布を示すということなのでしょう。

なお、心理統計学では正規分布をモデルにすることが多いのですが、抑うつ評価尺度のスコアは一般社会において指数分布を示します。なぜ指数分布を示すのかについては、追々説明していきたいと思います(今すぐに理解したい人は包括的に説明しているこのサイトを見てください。分量が多いので大変ですが)

なおこの研究で利用したK6というのは、Kesssler distress scaleの略です。この尺度はうつ病や不安障害の評価尺度としてよく使われます。ちなみに日本版K6は、この論文の共著者の古川 壽亮先生によって初めて作成されました