SOTON私人定制:利用Python进行数据分析( 数据导入导出)
数据导入导出 pandas支持多种类型的数据的读取,但是目前存放数据还是文本,比如说存放参考基因组的fasta文件,存放测序结果的fastq文件,为了降低宽带压力一般都会压缩一下文本。 本部分的函数总结使用幕布进行整理,地址为:https://mubu.com/doc/MnvB7a6T0 学习笔记: 数据导入面对最大的难题就是日益增加的文本数据量和有效的内存大小的矛盾,因此应该避免一次性导入全部数据,而是少量多次。 import pandas as pd pd.options.display.max_row = 10 # using nrows result_part = pd.read_csv('example/ex6.csv', nrows=5) # using chunks chunker = pd.read_csv('example/ex6.csv', chunksize=1000) tot = pd.Series([]) for piece in chunker: tot = tot.add(piece['key'].value_counts(), fill.value=0)...
