python 预测目标(y)的转换-低调大师

python 预测目标(y)的转换

2018-06-18 635

标签二值化

>>> from sklearn import preprocessing
>>> lb = preprocessing.LabelBinarizer()
>>> lb.fit([1, 2, 6, 4, 2])
LabelBinarizer(neg_label=0, pos_label=1, sparse_output=False)
>>> lb.classes_
array([1, 2, 4, 6])
>>> lb.transform([1, 6])
array([[1, 0, 0, 0],
       [0, 0, 0, 1]])

对于多类别是实例，可以使用:class:MultiLabelBinarizer:

>>> lb = preprocessing.MultiLabelBinarizer()
>>> lb.fit_transform([(1, 2), (3,)])
array([[1, 1, 0],
       [0, 0, 1]])
>>> lb.classes_
array([1, 2, 3])

标签编码

LabelEncoder是一个可以用来将标签规范化的工具类，它可以将标签的编码值范围限定在[0,n_classes-1]。这在编写高效的Cython程序时是非常有用的，:class:LabelEncoder可以如下使用:

>>>> from sklearn import preprocessing
>>> le = preprocessing.LabelEncoder()
>>> le.fit([1, 2, 2, 6])
LabelEncoder()
>>> le.classes_
array([1, 2, 6])
>>> le.transform([1, 1, 2, 6])
array([0, 0, 1, 2])
>>> le.inverse_transform([0, 0, 1, 2])
array([1, 1, 2, 6])

当然，它也可以用于非数值型标签的编码转换成数值标签（只要它们是可哈希并且可比较的）:

>>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
LabelEncoder()
>>> list(le.classes_)
['amsterdam', 'paris', 'tokyo']
>>> le.transform(["tokyo", "tokyo", "paris"])
array([2, 2, 1])
>>> list(le.inverse_transform([2, 2, 1]))
['tokyo', 'tokyo', 'paris']</pre>

微信关注我们

原文链接：https://yq.aliyun.com/articles/655618

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Java程序员如何正确地学习新的知识，拓展自己的技术栈

我的方法可能并不完全适合你，但是，我觉得这至少是我经过实践后认为比较靠谱的一种方法论。定个目标 & 自我驱动我不知道此刻正在看文章的你，目前处于人生的哪个阶段。但是，无论你处于哪个阶段，你有没有想过十年后的自己在做什么？关于自己的职业生涯，你有没有花一点时间给自己规划一下？或者说，你到底知不知道一个程序员，除了写代码之外，年龄越来越大之后的出路在哪里？下面是一张关于程序员的职业发展的图。希望你能在这里找到自己当前的定位。并清晰的知道自己未来发展的几种可能。然后你就有了目标。学习这件事，一定是要自我驱动的。只要自己不想学，任何好的学习方法其实都是没有用的。所以，要想高效的学习，首先是要从心理上接受，或者强迫自己学习。所以，制定目标之后，为了自己的目标努力奋斗，就是自我驱动的过程。一、有一个学习目标。这个不用我多说，你也可以明白。学习，要知道自己学什么。比如我每期成神之路留的作业，就是一个学习目标。二、有意的做扩展。对于一个新技术来说，自己在学习的过程中肯定会遇到各种各样的问题。比如某些概念自己不知道什么意思，某些知识点自己有遗漏。这个时候怎么办？我的建议是...

2018-06-18

661

在thoughtbot，我们用Ruby和Rails工作，但通常我们总是尝试使用最合适的语言或者框架来解决问题。我最近一直在探索机器学习技术，所以Python使用地更多。 Ruby项目和Python项目处理之间的一个很大的区别就是管理依赖关系方式的不同。目前在Python语言中没有类似于Bundler或Gemfiles的东西，所以通常Python开发人员将使用Virtualenv创建一个虚拟环境，再创建一个依赖包列表requirements.txt，然后他们可以使用 Pip进行安装。这种方法一般都会工作正常，但有时它会表现出一些怪异行为，因此你必须手动安装或删除某些特定版本的包，并记得定期更新requirements.txt文件，以保持项目环境的一致。特别是当你想要在你的虚拟环境中安装Python包，但它不一定与项目本身相关联。此外，一些项目有时会保留requirements.txt文件的两个版本——一个用于开发环境，一个用于生产环境，这可能会导致更多的复杂性。幸运的是，Kenneth Reitz的最新工具Pipenv可以用于简化Python项目中依赖项的管理。它汇集了Pip，P...

2018-06-18

631

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。