PyCaret 是 Python 中的一个开源、低代码机器学习库,可自动执行机器学习工作流。它是一种端到端的机器学习和模型管理工具,可成倍地加快实验周期并提高您的工作效率。
与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,可用于仅用几行代码替换数百行代码。这使得实验以指数方式快速和高效。PyCaret 本质上是几个机器学习库和框架的 Python 包装器,例如 scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray 等等。
PyCaret 的设计和简单性受到公民数据科学家的新兴角色的启发,这是 Gartner 首次使用的术语。公民数据科学家是高级用户,他们可以执行以前需要更多技术专业知识的简单和中等复杂的分析任务。
# install pycaret
pip install pycaret
# 读取数据
import pandas as pd
data_classification = pd.read_csv('data.csv')
data_classification.head()
# 导入分类模块,自动提取特征+自动填补缺失值
from pycaret.classification import *
clf1 = setup(data = data_classification, target = 'label_2day')#需修改
# 比较不同分类模型的性能
pycaret.classification.compare_models()
%matplotlib inline
%config InlineBackend.figure_format = "svg"
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=['SimHei']
plt.rcParams['axes.unicode_minus']= False #解决负数无法显示
# 建立决策树模型
dt = create_model('dt')
# 构建xgboost模型
xgb = create_model('xgboost')
# 建立LR型
lr = create_model('lr')
# 构建和调优LR模型
tune_lr = tune_model(lr)
# AUC-ROC 图
pycaret.classification.plot_model(lr, plot = 'auc')
# 决策边界
pycaret.classification.plot_model(lr, plot = 'boundary')
# Precision Recall 曲线
pycaret.classification.plot_model(lr, plot = 'pr')
# 评估模型
pycaret.classification.evaluate_model(lr)
# 解释模型:SHAP
interpret_model(xgb)
不得不感慨实在是强大啊,还有太多的东西要学习!
原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=9192