咨詢電話:18801099865
客服電話:010-67281139
微信:18801099865
郵箱:18801099865@163.com
醫學模型生產廠家就現實情況而言,健康的人遠比生病的人多,這也反映在醫療數據中,健康和疾病分類的樣本數量并不平均。你會發現,在醫療數據集和信用卡欺詐數據集中,正樣本的數量是負樣本的100倍。
所以,醫學模型生產廠家訓練的結果常常被誤認為表現良好,但事實并非如此。這發生在使用accuracy_score精確度這樣的簡單度量時。由于標簽存在嚴重的偏差,所有僅輸出普通標簽的神經網絡,其精度可略超過90%,在此情況下,只輸出普通標簽的神經網絡。
答:醫學模型生產廠家可以定義更多有用的指標,比如F1的測量方法或者“精確/回收”。精確性被定義為"真實樣本的數量/(真實樣本數量+虛假樣本數目)",這在大量假正例的情況下是一種良好的度量;另一方面,召回率被定義為"真實樣本數量/(真實樣本數量+虛假樣本數目)數量",這是一個好的衡量。大部分的醫學模型生產廠家都是如此,但是我們也經常需要考慮假正例數和假反例數,這就是F1度量的功能,它在精確度(Precision)和回收率(Recall)之間達到平衡,即公式2*(Precision*Recall)/(Precision+Recall)/(Precision+Recall)。
另一種處理類別失衡的常用方法是"重抽樣",也就是,從大多數類別(樣本太多的那一類)中刪除樣本(稱為欠采樣),或者在少數類別中增加樣本(稱為過度抽樣),以達到兩類的平衡。盡管復雜的重采樣技術能夠很好地解決這些問題,但也存在著信息丟失和過擬合等不足。
北京醫教科技有限公司
查看更多 >北京醫教科技有限公司專業研發銷售:醫教虛擬仿真模擬系統平臺,手術模擬訓練系統、影像診斷模擬系統、仿真手術模擬人、腹腔、宮腔、胸腔、胃鏡、腸鏡、關節鏡、推間孔鏡、泌尿鏡手術模擬訓練器、仿真解剖模型等...查看更多 >
姓名:
電子郵箱:
電話:
內容: