中藥材甘草高光譜數(shù)據(jù)采集與分析
(目的:高光譜識(shí)別真假甘草)
一、檢測目的和依據(jù)
使用高光譜技術(shù),采集中藥材中真甘草與假甘草光譜數(shù)據(jù),通過建模分析實(shí)現(xiàn)高光譜技術(shù)無損檢測甘草真假。
二、樣品類別及數(shù)量
甘草樣本:
中藥材真甘草若干條;
假甘草若干條;
三、檢測設(shè)備和方法
檢測設(shè)備
1. 400-1000nm高光譜相機(jī)
2. 高光譜采集暗箱
3. 黑色托盤(低反射率背景)
4. 輔助材料:標(biāo)簽(用于標(biāo)記真假甘草)
采集方式
1、訓(xùn)練集樣品擺放規(guī)則:
中藥材甘草:將樣品中藥材甘草按如圖所示擺放,使用標(biāo)簽標(biāo)記好甘草的真假。

2、驗(yàn)證集數(shù)據(jù)采集方式
將真假甘草擺放在托盤,標(biāo)記真假的標(biāo)簽放在了甘草樣品下面放著

四、采集與分析結(jié)果
樣本400-1000nm原始數(shù)據(jù)(包含 .dat、.hdr格式)
樣本400-1000nm反射率數(shù)據(jù)(包含 .dat、.hdr格式)
樣本400-1000nm高光譜圖像(.png格式)
1、使用打標(biāo)工具,甘草樣本進(jìn)行打標(biāo),結(jié)果圖如下 訓(xùn)練集:
驗(yàn)證集:

3.光譜反射率提取 真甘草(C1)和假甘草(C2)的反射率平均光譜圖
根據(jù)反射率曲線可以看出,真假甘草反射率存在較大差異
數(shù)據(jù)預(yù)處理
為了進(jìn)一步消除噪聲, 消除位置影響, 提升特征顯著性, 我們實(shí)驗(yàn)了多種預(yù)處理方法的組合, 最終選用預(yù)處理方式 SGD1 + SNV 對(duì)原始進(jìn)行處理.預(yù)處理后的 C1 和 C2 數(shù)據(jù)如下圖所示:

特征分析
根據(jù)波段和分組的相關(guān)性分析, 獲得分組相關(guān)性前 50 個(gè)波段位于下圖中紅色矩形區(qū)域

相關(guān)性最高的前 50 個(gè) 波段的 PCA 圖像

依據(jù)以上條件我們可以認(rèn)為:真甘草(C1)和假甘草(C2) 光譜數(shù)據(jù)在 628.02nm 到 731.77nm 之間存在較為明顯的差異
模型訓(xùn)練
模型采用我們自有的針對(duì)高光譜數(shù)據(jù)研發(fā)的深度學(xué)習(xí)模型架構(gòu),更容易捕獲特征與標(biāo)簽之間的非線性關(guān)系。
訓(xùn)練數(shù)據(jù)使用上文中的 訓(xùn)練集01,訓(xùn)練 20 個(gè) Epoch,每個(gè) Epoch 結(jié)束后使用驗(yàn)證集進(jìn)行一次評(píng)估
訓(xùn)練過程中損失下降情況如下圖所示:

訓(xùn)練后在訓(xùn)練集上的推理結(jié)果:

對(duì)比基線模型(KNN)準(zhǔn)確率
驗(yàn)證集01評(píng)價(jià)結(jié)果

驗(yàn)證集02評(píng)價(jià)結(jié)果

結(jié)果評(píng)價(jià):
對(duì)比訓(xùn)練集, 模型能力有所下降, 但準(zhǔn)確率依然高于基線模型 10% ~ 20%
模型能力下降的主要原因是訓(xùn)練樣本不夠, 使用更多樣本進(jìn)行訓(xùn)練可以有效提升模型泛化能力
經(jīng)過后處理, 即: 在空間維度對(duì)標(biāo)簽做平滑處理 + 對(duì)單個(gè)樣本使用置信度 (樣本中標(biāo)記為真的光譜數(shù)量 / 樣本中所有光譜的數(shù)量) > 0.8 可以實(shí)現(xiàn)對(duì)驗(yàn)證集中樣本識(shí)別做到 100% 準(zhǔn)確率

電話
微信