特征提取
#将影像文件和掩膜文件放在一个地方
#导入库
import radiomics
import numpy as np
import pandas as pd
from radiomics import featureextractor
#定义提取器
extractor = featureextractor.RadiomicsFeatureExtractor()
#提取影像组学特征
featureVector_1 = extractor.execute('lung1_image.nrrd','lung1_label.nrrd')
#查看特征
featureVector_1
df1 = pd.DataFrame([featureVector_1])
df1
#提取影像组学特征
featureVector_2 = extractor.execute('lung2_image.nrrd','lung2_label.nrrd')
#查看特征
featureVector_2
df2 = pd.DataFrame([featureVector_2])
df2
假如是很多组数据,有10组image和他的掩膜image-label,则
#建立空的数据集
data_A = pd.DataFrame()
list_1 = np.arange(1,11)
for i in list_1:
imagname = 'lung' + str(i) + '_image.nrrd'
maskname = 'lung' + str(i) + '_label.nrrd'
featureVector = extractor.execute(imagname,maskname)
df_add = pd.DataFrame([featureVector])
data_A = pd.concat([data_A, df_add])
提取完以后可以使用.to_excel(‘data_A.xlsx’)来保存。
数据筛选
提取完的数据可能存在很多非数字格式的数据,如下:
需要转换,使用代码将非数据格式的剔除,数据A和B组同样执行。
data_A_ = pd.DataFrame()
colums_A = data_A.columns
for col in colums_A:
try:
df = data_A[col].astype(np.float64)
data_A_ = pd.concat([data_A_,df],axis=1)
except:
pass
continue
提取好了以后开始做比较,筛选出影响组的有差异的特征
假如要检查方差齐性,则如下:
原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=17855