字幕组双语原文:Python简化代码机器学习库PyCaret 2.0发布

翻译:雷锋字幕组(Shangru)

雷锋字幕组是一个由 AI 爱好者组成的翻译团队,汇聚五百多位志愿者的力量,分享最新的海外AI资讯,交流关于人工智能技术领域的行业变革与技术创新的见解。

样本和划分:训练/测试划分;采样

和名字一样,该函数用于推理/预测。以下是使用方法:

此外,《华盛顿邮报》指出,在疗养机构的抗疫过程中,美国各州层面的卫生部门会行使监管的职能,但并没有动员起来,亲自采取措施来应对疫情。

PyCaret 2.0包括了几种新的util函数。当你在PyCaret中管理机器学习实验时可以方便的使用。其中一些如下所示:

和其他开源机器学习库相比,PyCaret是低代码的。它可以用几个单词取代上百行代码。这大大提高了实验的速度和效率。在版本说明 release notes  中查看PyCaret 2.0的更多细节。

模型调优函数以估计器的形式调优模型超参数。它在预设定的调优网格( 可完全定制化 )上进行随机网格搜索。以下是几种函数使用方法:

模型作图函数可用于评估训练已完成的机器学习模型的性能评估。示例如下:

“如果没有充足资金 美国将重蹈覆辙”

无监督:创建聚类;异常移除

该脚本动态选择并保存最佳模型。只需要短短几行代码,你就开发好了自己的AutoML软件,还带有完整的日志系统和漂亮榜单的UI界面。

所有的依赖项会在使用pip安装PyCaret时自动安装。点击Click here这里查看完整的依赖列表。 

因此,美国卫生保健协会和美国国家辅助生活中心敦促国会为卫生部和医疗服务提供者援助基金追加拨款1000亿美元,将其中部分资金专门用于援助疗养机构和辅助生活机构,帮助它们获得充足的抗疫资源,包括购置个人防护装备、安排检测、人力支持等。

PyCaret 2.0以后端API的形式嵌入了机器学习工作流的追踪组件,并提供UI在你运行机器学习代码时记录参数,代码版本,度量以及输出文件,以供之后的结果可视化。你可以如下记录你PyCaret中的实验:

《华盛顿邮报》援引专家分析称,疗养机构应该采取的主要措施,就是定期对住客和职工进行新冠病毒检测。报道称,美国疾控中心要求疗养机构至少每月两次,甚至每周一次开展定期检测,得克萨斯州、俄克拉何马州和亚利桑那州也都对疗养院作出了相应要求。

在PyCaret中,任何机器学习实验的第一步是配置环境。这需要导入相关模型并通过传递数据框(dataframe)和目标变量的名字来初始化配置函数。示例代码如下:

团队成员有大数据专家、算法工程师、图像处理工程师、产品经理、产品运营、IT咨询人、在校师生;志愿者们来自IBM、AVL、Adobe、阿里、百度等知名企业,北大、清华、港大、中科院、南卡罗莱纳大学、早稻田大学等海内外高校研究所。

我们激动的宣布,PyCaret第二版今天发布!

美国卫生保健协会和美国国家辅助生活中心总裁兼首席执行官马克·帕金森(Mark Parkinson)表示:“目前,很多疗养院和护理机构依然缺乏个人防护设备、无法进行充分的病毒检测,状况非常不好。这是一步倒退。”

这是所有监督学习模型任务中,我们推荐的第一步。该函数会使用模型的默认超参数来训练所有模型,并通过交叉检验来评估性能。它返回一个已训练的模型的对象类。可使用的评估测度包括:

“因此,疗养院提交的计划都变成了一纸空谈。” 麦克·达克说道。

雷锋网版权文章,。详情见转载须知。

根据美国国会3月份通过的经济刺激法案(CARES Act),医疗服务提供者援助基金(Provider Relief Fund)的资金规模为1750亿美元。但是美国卫生保健协会和美国国家辅助生活中心发言人称,疗养机构从中得到的援助仅有140亿美元,

“漫长周期使得检测失去意义”

模型创建函数使用默认超参数训练模型并使用交叉验证评估模型性能。该函数是几乎所有其他PyCaret函数的底。它返回训练模型对象类。以下是几种模型使用方法:

特征选择:特征重要性;共线性移除;PCA;忽略低方差

要了解更多模型集成函数,点击这里 click here.

《今日美国报》17日援引马克·帕金森评论称,疗养院中确诊病例上升,是受到了7月份美国西部和南部疫情蔓延的影响。由于疗养院的住客们生活范围交叉,很多人还有潜在的健康问题,他们尤其容易感染新冠肺炎,产生并发症而死亡。马克·帕金森指出,社区传播控制不力、新冠病毒检测所需周期长是美国疗养机构抗疫过程中长期存在的问题。

如果,你也是位热爱分享的AI爱好者。欢迎与雷锋字幕组一起,学习新知,分享成长。

所有的预处理变换在配置函数中被调用。PyCaret提供了超过20种不同的,可在配置函数内调用的预处理变换。点击这里 Click here 了解PyCaret更多的预处理能力。

分析和截图 模型选择 实验日志记录(从左到右)

通过使用这些函数,让我们创建一个简单的命令行软件来使用默认参数来训练多个模型,对最好的几个候选模型进行超参数调优,尝试不同的集成技术并返回/保存最优模型。以下是命令行脚本:

要了解更多关于模型创建函数,点击这里 click here.

报道称,在俄克拉何马州,疗养机构申请联邦资金援助时,需要提交“防疫计划”;在亚利桑那州,所有正规疗养机构被要求完成防疫调查问卷,甚至在上一份问卷还没有填写完成时,又会收到新的问卷。

管理不善 疗养机构难以得到援助

但目前各疗养机构只完成了一轮检测,因为人们要等至少一周才能拿到检测结果。《华盛顿邮报》评论称:“漫长的等待周期使检测变得没有意义,因为在此期间,病毒可能已经广泛传播开来。”

缩放和转换:归一化;转换

特征工程:特征交互;多项式特征;组特征;二元数值特征

美国加州疗养院改革倡导组织(California Advocates for Nursing Home Reform)的专家麦克·达克(Mike Dark)则批评称,尽管加州卫生机构要求各疗养院提交新冠病毒检测计划,但它们并没有为疗养院铺开检测提供任何实质性帮助,而是将该任务推给各个县级卫生部门。但许多乡村地区和财政困难的县受疫情冲击,税收暴跌,根本无力承担这种任务。麦克·达克进一步指出,这些财政困难县很难向疗养院提供个人防护装备,也无法给疗养院职工提供防疫培训。

美国有线电视新闻网(CNN)17日援引马克·帕金森评论指出:“如果没有足够的资金和资源,美国最终将重蹈几个月前的覆辙。公共卫生官员需要在分配个人防护设备、测试、人员和资金时,将疗养机构放在优先位置。”

要了解更多模型调优函数,点击这里 click here.

安装PyCaret非常简单,只需要几分钟时间。我们强烈建议使用虚拟环境,以避免和其他库的潜在冲突。以下示例代码创建了一个conda环境,并在该conda环境下安装pycaret

整合——创建你自己的AutoML软件

数据准备 模型训练 超参数调优(从左到右)

近期,美国卫生保健协会(AHCA)对463家疗养服务供应商进行调查发现,由于要采取防疫措施,疗养院在防护设备、检测、人力方面的支出增长,目前有55%的疗养院处于亏损状态,其中72%的疗养院表示,按照目前的状况,他们无力维持下一年的运营。

PyCaret是一个开源的,低代码的Python机器学习库,旨在自动化机器学习工作流。它是端到端的机器学习和模型管理工具。它可以加速机器学习的实验周期,提高你的效率。

通过这个轻量级工作流自动化Python库,你可以完成无限可能。

雷锋网(公众号:雷锋网)雷锋网

Next Post

环境大变样发展添能量

周日 1月 24 , 2021
环境大变样 发展添能量(走向我们的小康生活) 一条 […]