编程语言
-
R语言:连续变量取最佳cutoff值
基于KM曲线 使用KM曲线取连续变量的最佳cutoff值。其基本原理是基于log-rank检验,使某点两侧的数据有最佳的差异性。此法转换的分类变量的单因素cox回归分析往往都有意义…
-
超强图解 Pandas 18 招
Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。 sort_values 执行步骤: size列筛选出部分行…
-
Pandas数据挖掘分析神器Bamboolib
在使用之前,我们先需要通过pip install进行该模块的安装 在上面的步骤全都完成之后,我们开始简单的来尝试使用一下bamboolib,导入我们需要用到的模块,导入数据 会弹出…
-
Python绘制tableone和可视化
数据文档来源: Table1的绘制 绘制图
-
Python For Data Science Cheat Sheet: plotnine
plotnine 是Python中图形语法的实现,它基于ggplot2。plotnine 最初是为了改进 ggpy中的缩放功能,正式名称为“ggplot for python”。将…
-
pandas.get_dummies 的用法
get_dummies 是利用pandas实现one hot encode的方式。官方文档:https://pandas.pydata.org/pandas-docs/stable…
-
Python:倾向性评分匹配
倾向性评分匹配(propensity score matching, PSM)主要是在随机对照试验(Randomized controlled trials,RCT)中用于衡量tr…
-
Python:PSM倾向得分匹配法
倾向评分匹配(Propensity Score Matching,PSM)的目地是控制非处理因素的干扰,突显处理因素的的效应。数据集来源于“顾先生聊数据”,链接地址:https:/…
-
Jupyter Lab插件:jupyter-matplotlib、JupyterLab-DrawIO、jupyterlab-kite
jupyter-matplotlib Matplotlib/ipympl 项目地址:https://github.com/matplotlib/ipympl。jupyter-mat…
-
25个常用Matplotlib图的Python代码
大家好,今天要分享给大家25个Matplotlib图的汇总,在数据分析和可视化中非常有用,文章较长,可以马起来慢慢练手。 1. 散点图 Scatteplot是用于研究两个变量之间关…
-
Python数据类型
数据类型: – 数据:整数、浮点数 – 字符串:单引号或双引号、转义字符(\)、r”…”、”’… ̵…
-
转载:1w 字的 pandas 核心操作知识大全!
引入依赖 算法相关依赖 获取数据 生成df 重命名列 增加列 缺失值处理 独热编码 替换值 删除列 groupby 透视表 数据筛选 差值计算 数据修改 时间格式转换 设置索引列 …
-
常用的几个 Python 函数解决数据处理任务
1、读取数据并查看shape及列索引 2、删除某几列 3、读取部分列数据,可以使用 usecols 参数 4、nrows,创建了一个包含 csv 文件前 400行的数据帧。还可以使…
-
Python移除图片白色背景
在使用图片的时候有时候我们希望把背景变成透明的,这样就只关注于图片本身。解决办法:我们需要使用RGBA(Red,Green,Blue,Alpha),将alpha的透明度变为0,这样…
-
使用python将多份pdf文件合并成一份
PyPDF2 是一个功能虽然不是很多,但却非常好用的第三方库,它提供了pdf文件的读写,拆分,合并等功能,使用pip命令进行安装。 下面是一份合并文件的示例代码