米国立衛生研究所(NIH)、英オックスフォード大学、米ノースウェスタン大学に所属する研究者らが発表した論文「Digital Omicron detection using unscripted voice samples from social media」は、動画内の音声の変化を分析し、話者が新型コロナウイルス感染症(以下、コロナ)に感染しているかどうかを検出する機械学習モデルを提案した研究報告である。
コロナに感染すると、発熱や鼻水、せき、のどの痛み、味覚と嗅覚の異常、体のだるさなどの症状が生じる。またオミクロンの変種は、上気道に影響を及ぼすことが多く、咳やその他の呼吸器症状を伴わない音声変化をもたらすことがよくある。
今回は、一般的に行われる鼻腔または咽頭スワブを用いたポリメラーゼ連鎖反応(PCR)による感染検出ではなく、音声変化による感染検出を試みた。
この研究では、オーディオクリップから音声の変化でコロナに感染したかを分類する機械学習モデルを提案する。音声サンプルは、YouTubeから取得したものをモデルの学習に用いる。そのままでは使えないため、無音時間や話し手以外の雑音を取り除くなどの前処理をしてから与える。
これらの音声サンプルには、オミクロンが流行っている時期にコロナが陽性であると自己申告した人の音声データが含まれ、同時に非オミクロンのコロナの変種や他の上気道感染(風邪やインフルエンザ、鼻炎、扁桃炎、咽頭炎、喉頭炎など)、健常者も含まれる。
具体的には、オミクロン変異型が流行っているときにコロナに感染したと答えた人が183人(28.39時間)、オミクロン以前のコロナ感染者120人(22.84時間)、コロナではない上気道感染にかかったと答えた人が138人(8.09時間)、どの呼吸器感染にもかかったことがないと答えた人が192人(33.90時間)である。
得られたデータセットを用いて、音声の変化からオミクロンを検出するDenseNetモデルを学習させた。
学習済みモデルでテストした結果、次の通りになった。オミクロンを健常者と区別する特異度(感染していない人を正しく感染していないと識別する確率)は85%、感度(感染している人を正しく感染していると識別する確率)は80%であった。
さらにオミクロンと上気道感染とを区別できるかテストした結果、特異度74%、感度70%で識別できると分かった。つまり、インフルエンザなどの他の呼吸器系症状とオミクロンを区別できたことを示し、オミクロンに感染した人は特有の音響マーカーが含まれていることを示唆した。