睡眠呼吸暫停是一種在睡眠期間人的呼吸中斷時(shí)發(fā)生的疾病,估計影響了大約2200萬(wàn)美國人。麻煩的是,大部分病例--80% - 未被診斷,如果不及時(shí)治療,睡眠呼吸暫停會(huì )增加患冠狀動(dòng)脈疾病,心臟病,心力衰竭和中風(fēng)的風(fēng)險。

一個(gè)研究領(lǐng)域 - 自動(dòng)打鼾聲音分類(lèi),或ASSC--旨在開(kāi)發(fā)一種基于打鼾聲音的睡眠呼吸暫停診斷方法(睡眠呼吸暫停的特點(diǎn)是減少或完全停止氣流的重復發(fā)作)。但是,盡管近年來(lái)取得了進(jìn)展,但仍然缺乏可以訓練ASSC系統的標記數據。
這就是為什么倫敦帝國理工學(xué)院,奧格斯堡大學(xué)和慕尼黑技術(shù)大學(xué)的研究人員在一篇新論文(“ Snore-GANs:用合成數據改進(jìn)自動(dòng)打鼾聲音分類(lèi) ”)中尋求開(kāi)發(fā)創(chuàng )造合成的生成對抗網(wǎng)絡(luò )(GAN)的原因。數據填補實(shí)際數據的空白。(對于沒(méi)有經(jīng)驗的人來(lái)說(shuō),GAN是由生成樣本和鑒別器的生成器組成的兩部分神經(jīng)網(wǎng)絡(luò ),試圖區分生成的樣本和現實(shí)樣本。)然后使用增強數據集來(lái)訓練ASSC。
“在進(jìn)行數據增強時(shí),我們聚合來(lái)自所有[GAN]的數據,并從池中隨機選擇進(jìn)一步合并到原始訓練集中的數據。通過(guò)這樣做,預計將擴大來(lái)自單獨[GAN]的增強數據的多樣性,“該論文的作者解釋說(shuō)。
為了驗證他們的方法,他們使用了一個(gè)公開(kāi)的數據集 - 慕尼黑 - 帕薩鼾聲音庫(MPSSC) - 在打鼾時(shí)對上呼吸道內的振動(dòng)位置進(jìn)行分類(lèi),從德國三個(gè)醫療中心現有的檢查記錄開(kāi)始2006年至2015年期間的臨床檢查。根據隨附視頻記錄的結果,選擇的打鼾事件由醫療耳鼻喉專(zhuān)家分類(lèi),注釋的樣本分為獨立于受試者的培訓,開(kāi)發(fā)和測試集。
那個(gè)方法怎么樣呢?該論文的作者報告說(shuō),他們成功地生成了與原始數據共享分布的數據,從而導致培訓數據量的增加,而無(wú)需人工注釋。此外,他們說(shuō),合成和原始數據的結合改善了分類(lèi)器的性能。
“未來(lái),我們將不斷收集來(lái)自不同醫院和患者的更多鼾聲數據,以增加數據量和多樣性,我們將重新評估所提出的方法,”研究人員說(shuō)。“此外,我們將在以下工作中進(jìn)一步提出和評估更先進(jìn)的......系統,以改進(jìn)聲學(xué)序列生成模型。”
