国产麻豆一精品一av一免费,日韩精品中文字幕一区二区三区 ,国产一区美女,欧美一性一交

非平衡分類技術(shù)在人群糖尿病疾病風(fēng)險(xiǎn)預(yù)測(cè)模型中的應(yīng)用

武海濱; 李康; 楊麗; 胡如英; 鐘節(jié)鳴; 游頂云; 郭彧; 卞錚; 李立明; 陳錚鳴 浙江省疾病預(yù)防控制中心; 310051; 哈爾濱醫(yī)科大學(xué); 浙江醫(yī)院; 昆明醫(yī)科大學(xué); 中國(guó)醫(yī)學(xué)科學(xué)院; 北京大學(xué); 英國(guó)牛津大學(xué)

關(guān)鍵詞:風(fēng)險(xiǎn)預(yù)測(cè) 非平衡分類 機(jī)器學(xué)習(xí) 流行病 

摘要:目的分析比較幾種常用的非平衡分類技術(shù)在人群糖尿病疾病風(fēng)險(xiǎn)預(yù)測(cè)模型中的應(yīng)用。方法利用中國(guó)慢性病前瞻性研究浙江省桐鄉(xiāng)市項(xiàng)目點(diǎn)基線調(diào)查數(shù)據(jù)和隨訪數(shù)據(jù),使用機(jī)器學(xué)習(xí)算法建立人群糖尿病發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)模型,同時(shí)探討欠采樣、過采樣、SMOTE技術(shù)及替換切點(diǎn)技術(shù)對(duì)分類器性能的影響。結(jié)果本研究中神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的AUC值最高,達(dá)0.7971,經(jīng)最優(yōu)切點(diǎn)的選擇和分類后,靈敏度和特異度分別為0.7149和0.7431,模型具有較高的預(yù)測(cè)能力,同時(shí)較好的平衡了靈敏度和特異度的分布。采樣法對(duì)不同分類器的AUC值影響不同,一般欠采樣比過采樣具有更高的AUC值;隨著SMOTE中少數(shù)類比例的上升,AUC出現(xiàn)下降的趨勢(shì)。結(jié)論使用神經(jīng)網(wǎng)絡(luò)結(jié)合替換切點(diǎn)技術(shù)建立的人群糖尿病5年發(fā)病風(fēng)險(xiǎn)模型具有較高的預(yù)測(cè)能力,并能夠較好的處理非平衡數(shù)據(jù)的影響。

中國(guó)衛(wèi)生統(tǒng)計(jì)雜志要求:

{1}計(jì)量單位以國(guó)家法定計(jì)量單位為準(zhǔn);統(tǒng)計(jì)學(xué)符號(hào)按國(guó)家標(biāo)準(zhǔn)《統(tǒng)計(jì)學(xué)名詞及符號(hào)》的規(guī)定書寫。

{2}本刊維護(hù)首發(fā)權(quán),切勿一稿多投。稿件寄出3個(gè)月內(nèi)未收到用稿通知者,作者可自行處理。來稿一律不再退還。

{3}文章題名應(yīng)簡(jiǎn)潔、確切、真實(shí)反映文章的主題特色。不超過20字,避免使用非公知公用的縮略字、代號(hào)等(一般不用副標(biāo)題)。

{4}參考文獻(xiàn):引文務(wù)必準(zhǔn)確,參考文獻(xiàn)表中列出的應(yīng)限于作者直接閱讀過的、最主要的、發(fā)表在正式出版物上并且在文章中直接引用的文獻(xiàn);按GB7714-87的規(guī)定采用順序編碼標(biāo)注制著錄。

{5}通訊作者(第一作者)簡(jiǎn)介:包括姓名、出生年、性別、民族(指少數(shù)民族)、籍貫、職稱(學(xué)位)及研究方向(附Email與電話號(hào)碼)。

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

中國(guó)衛(wèi)生統(tǒng)計(jì)

北大期刊
預(yù)計(jì)1-3個(gè)月審稿

期刊主頁
相關(guān)期刊
我們的服務(wù)
主站蜘蛛池模板: 垣曲县| 谢通门县| 阿鲁科尔沁旗| 郧西县| 运城市| 杭锦后旗| 上犹县| 宿松县| 祁连县| 甘孜| 鄄城县| 海南省| 徐汇区| 玉林市| 兖州市| 荥经县| 新建县| 江川县| 望奎县| 卫辉市| 和政县| 福海县| 巴南区| 昌都县| 广南县| 万源市| 淮南市| 甘孜县| 宜宾县| 固镇县| 安顺市| 杭锦后旗| 离岛区| 华安县| 龙山县| 临湘市| 雅江县| 元阳县| 吴旗县| 东乡| 冀州市|