建模常用的pandas语句
pandas对象是Python常用的数据分析模块,它主要包括series对象,dataframe对象和index对象。每种对象都有自己所特有的方法和属性。今天小编更新下建模中常用的pandas语句。
额外提一句哈。小编不私聊哈,有事的话请加qq群的,微信群已满。
1.导入pandas和numpy模块
import pandas as pd
import numpy as np
import os
2.查看并更改工作路径
pwd
os.chdir('更改的路径')
3.读入数据集
df=pd.read_csv(r'文件路径')
4.查看列数、行数
print(df1.columns.size,df.iloc[:,0].size)
5.查看列名
df.columns.tolist()
6.查看每个特征的类型
for col in fk_df.columns:print(col,fk_df[col].dtype)
7.计算坏账率
badRate=df['target'].sum()/df['target'].count()
8.计算特征空值率
null_rate=1-df.count()/df.shape[0]
9.保留空值率小于0.2的特征
cols=null_rate[null_rate<0.2].index.tolist()
10.查找数据集数值中型特征小于0的值并置为nan
def rep(x):if type(x)!=str and x<0:print(x)return np.nan return x df=df.applymap(rep)
11.设置新的索引
df=df.reindex()
12.检查常量特征
df1=df.loc[:,df1.apply(pd.Series.nunique)!=1]
13.查看是否有重复特征
len(set(list(df1.columns)))==df1.shape[1]
14.查看特征类别数
df1['education'].value_counts()
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Django学习笔记(一)
image.png 最近有个需求,老大让用 Django 来做,以前入门 Python 时就听过 Django 的大名,今日一见果然名不虚传~~~~。 特点 Django 最大的特点就是快速建站: 快速开发 内置应用 后台admin 用户认证系统auth 会话系统sessions 安全性高 表单验证 SQL注入 跨站点攻击 易于拓展 ....很多,这里不一一列举。 Django 应用(app)的概念 项目VS应用 项目与应用之间有什么不同之处?应用是一个提供功能的 Web 应用 – 例如:一个博客系统、一个公共记录的数据库或者一个简单的投票系统。 项目是针对一个特定的 Web 网站相关的配置和其应用的组合。一个项目可以包含多个应用。一个应用可以在多个项目中使用。 Django使用应用来分割功能,也就是app,每个应用分别为不同的app。 例如:我们创建一个电商网站,那么里边的购物车、用户管理、支付系统都可以成为独立的模块,也就是独立的三个app,这些模块可以用在别的网站中,不单单只针对于当前网站。 Django Demo Python版本2.7 Django版本1.8 查看已安装Dja...
- 下一篇
pyhanlp用户自定义词典添加
pyhanlp是python版封装的的HanLP,项目地址:https://github.com/hankcs/pyhanlp 经过测试,HanLP比nltk在中文分词和实体识别方面都更好用。 如何向pyhanlp添加自定义的词典?以python 2.7.9为例: 1.安装pyhanlp:pip install pyhanlp 2.在字典路径下添加自定义的词典:CustomDictionary主词典文本路径是data/dictionary/custom/CustomDictionary.txt,用户可以在此增加自己的词语(不推荐);也可以单独新建一个文本文件,通过配置文件;CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt; 我的词典.txt;来追加词典(推荐)。 具体绝对路径可用hanlp --version获取: hanlp --version jar 1.6.3: /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp-1.6.3.jard...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程