t0nAr1sm

Appleを理解して翻訳する。それが「となりずむ」

Apple Watch300万日分のデータで病気を予測する新AIモデル「JETS」とは

Apple Watchを腕につけたユーザーが、画面の「Start」ボタンに触れようとしている様子。ディスプレイには赤と青の波形アニメーションが表示され、ヘルス関連の計測を開始するイメージが描かれている。

✅この記事では、Apple Watchの膨大なデータを使って病気の兆候を予測する新しいAIモデル「JETS」について整理します。MITとEmpirical Healthの研究チームが明らかにした内容で、「ウェアラブルの不完全なデータをどう活かすか」という難題に挑んだ研究なんです。

どうも、となりです。

Apple Watchのデータって、毎日記録しているつもりでも、実は抜けが多いんですよね。寝る前に外したり、運動中だけ活発に記録されたり、日によって密度がバラバラです。今回の研究は、その“穴だらけ”とも言えるデータをむしろ味方にして、病気のリスクを読み取ろうという試みなんです。

Apple Watch「300万日分データ」が研究の土台に

今回の研究は、16,522名分のApple Watchデータを集め、合計約300万日分に相当する長期記録を学習に利用しています。内容は心拍、呼吸、睡眠、活動量など、日々の生活に関わる63種類のデータです。

ポイントは、医療データとして病名がわかっている参加者が全体の15%しかいなかったということです。普通のAIでは、この“85%のラベルなしデータ”は使えません。しかし今回のモデルは違いました。高血圧に関しては、Apple Watchが正式に測定機能を広げようとしている動きもあり、このあたりは以前まとめたApple Watchの高血圧対応の拡大ともつながる部分なんですよね。

JEPAという新しい発想:「欠けた部分の“意味”を読むAI」

今回の研究は、Metaのヤン・ルカン氏が提唱したJEPA(Joint-Embedding Predictive Architecture)を応用しています。これは、少し不思議な考え方なんです。

多くのAIは欠けているデータを「埋める」方向で考えますが、JEPAは逆で、欠けている部分の“意味だけ”を推測する仕組みなんです。

たとえば、Apple Watchの記録が急に薄くなっている日があるとします。それを「データが欠けてるから無効」と判断するのではなく、

「こういうパターンのとき、人の体はどういう状態になりやすいのか?」

という“文脈”を予測します。これは「データの穴を埋めるAI」ではなく、

「データが持つ世界観を理解するAI」

という方向に大きく舵を切ったアプローチなんです。

JETS:不完全なデータでも“世界観”を学習するAI

今回使われたJETSモデルは、このJEPAを長期間のApple Watchデータ(時系列)に最適化したバージョンです。

仕組みの流れは次のようになっています。

  • Apple Watchの記録を「日 × 値 × 種類」で“ひとかたまりの観測”として扱う
  • その観測を“トークン”としてモデルに入れる
  • 一部のトークンをわざと隠す
  • モデルはその“隠された部分の意味”を推測する

これを延々と学習させると、モデルはやがて「人の心拍や睡眠はどう変動するのか」「体調の崩れる前にはどんなパターンが出るのか」といった“世界の構造”を理解していきます。

その上で、病名ラベルのある15%のデータで微調整すると、疾患予測がぐっと精度良くなるわけです。

どのくらい予測できたのか?(AUROCのイメージ)

今回の研究では、AIの識別性能を見る指標としてAUROCが使われました。数字の意味をかみ砕くと、「症状が出そうな人を、出なさそうな人よりうまく上位に並べられるか」という能力を示しています。

JETSが示した主な数値は次の通りです。

  • 高血圧:86.8%
  • 心房粗動:70.5%
  • 慢性疲労症候群:81%
  • 洞不全症候群:86.8%

AUROCが50%なら「コイントスと同じ」、90%近くなら「かなり鋭く判別できる」という感覚なので、今回の数字はなかなかの成果なんですよね。

 

 

注目したいポイント

不完全なデータを“弱点”ではなく“味わい”に変えた研究

Apple Watchのデータは日によって濃淡があります。毎日が同じわけじゃないからです。従来のAIではこの不規則性は大きな弱点でしたが、JETSはむしろこの揺らぎから人の生活のクセやリズムの“意味”を拾ったという点が革新的です。

ラベルが少ない現実世界のデータに強い

医療データはラベル(診断情報)が少ないのが当たり前です。なので、今回のように85%がラベルなしでも学習に貢献できる手法は、今後のヘルスケアAIとしてとても実用的なんです。

ウェアラブルの価値が“使い方次第で変わる”時代へ

今回の研究は、「データそのものより、そこに含まれる関係性や文脈が重要」という方向性を示しています。Apple Watchのような市販のウェアラブルでも、工夫次第でここまで医療に近い領域に踏み込めるのか、という驚きがありますよね。Appleが構想しているとされるHealth+とAIドクター構想のようなサービスと組み合わされば、「日常のログがそのまま診断のヒントになる」世界も、ぐっと現実的になってきます。

ひとこと:不完全なデータにこそ“生活の手がかり”がある

個人的に、この研究でいちばん面白いと感じたのは、「データの欠け方にも意味がある」という視点でした。人は同じ生活を毎日送っているようで、じつは睡眠・心拍・行動には癖があって、それが健康状態と密接につながっているんですよね。

そうした“生活の揺らぎ”から兆候をつかむという考え方は、ヘルスケアAIの方向性としてとても魅力的ですし、今後のApple Watchや健康サービスの進化にもつながりそうです。あなたは、この研究のどの部分に可能性を感じますか?

まとめ:欠けたデータを“価値”に変えた研究

研究内容をあらためて整理すると、次のようになります。

  • Apple Watch 300万日分のデータをAIが学習
  • JEPAという「意味を推測するAI」で不規則なデータを扱える
  • ラベルが少なくても高い予測性能を発揮
  • ウェアラブルの健康活用に新しい道を示している

データが揃っていない現実の世界でこそ、この手法は力を発揮します。医療AIの可能性を広げる研究として、今後の応用にも注目したいですね。

ではまた!

Source: 9to5Mac