python文件基础之(文件操作)
在之前学习了python的列表、元组、集合等知识,接下来将python的文件相关的知识做一总结和分析。 一 open函数 在我们用word、excel、vim对文件操作时,肯定要先打开文件,同样在编程里面也是需要将文件打开,然后再对文件操作,操作完对文件进行关闭。文件打开使用open()函数,同时创建一个相关的对象。 、基本语法: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 open ( file ,mode = 'r' ,buffering = None ,encoding = None ,errors = None ,newline = None ,closefd = True ) 参数介绍: file :表示文件名,可以使用绝对路径和相对路径,还有可以根据mode方式决定文件的追加或者覆盖 mode:表示打开文件的模式 buffering:设置缓存模式。 0 表示不缓存, 1 表示缓存;如果大于 1 则表示缓冲区的大小,以字节为单位。 encoding:表示打开文件的编码格式 errors:参数errors是用来指明编码和解码错误时怎么样处理。不能在二进制的模式下使用。 1 )当指明为’strict’时,编码出错则抛出异常ValueError。 2 )当指明为’ignore’时,忽略错误。 3 )当指明为’replace’时,使用某字符进行替代模式,比如使用’?’来替换出错的。 4 )其它相应还有surrogateescape / xmlcharrefreplacs / backslashreplace。 newline: 参数newline是用来控制文本模式之下,一行的结束字符。可以是 None ,’’,\n,\r,\r\n等。 当在读取模式下,如果新行符为 None ,那么就作为通用换行符模式工作,意思就是说当遇到\n, \r或\r\n都可以作为换行标识,并且统一转换为\n作为文本输入的换行符。当设置为空’’时, 也是通用换行符模式工作,但不作转换为\n,输入什么样的,就保持原样全输入。当设置为其它相应 字符时,就会判断到相应的字符作为换行符,并保持原样输入到文本。 当在输出模式时,如果新行符为 None ,那么所有输出文本都是采用\n作为换行符。如果设置为’’ 或者\n时,不作任何的替换动作。如果是其它字符,会在字符后面添加\n作为换行符。 closefd:是用来当给一个文件句柄传进来时,而当退出文件使用时,而不对文件句柄进行关闭。如果传 递一个文件名进来,这个参数无效,必定为 True 方式。 关于上面提到的mode模式种类比较多,我们做以下相关介绍和总结, 模式 描述 r 打开一个文件为只读。文件指针置于该文件的开头。这是默认模式。 rb 打开一个文件只能以二进制格式读取。文件指针置于该文件的开头。这是默认模式。 r+ 打开用于读取和写入文件。文件指针将会在文件的开头。 rb+ 打开用于读取和写入二进制格式的文件。文件指针将会在文件的开头。 w 打开一个文件只写。覆盖该文件,如果该文件存在。如果该文件不存在,则创建用于写入一个新的文件。 wb 打开一个文件只能以二进制格式写入。覆盖该文件,如果该文件存在。如果该文件不存在,则创建用于写入一个新的文件。 w+ 打开用于写入和读取的文件。覆盖现有的文件,如果文件存在。如果该文件不存在,则创建读取和写入新的文件。 wb+ 打开用于写入和读取的二进制格式的文件。覆盖现有的文件,如果文件存在。如果该文件不存在,则创建读取和写入新的文件。 a 将打开追加文件。文件指针是在文件的结尾。也就是说,该文件是在附加模式。如果该文件不存在,它创造了写入一个新的文件。 ab 将打开追加的二进制格式的文件。文件指针在该文件的结束。也就是说,该文件为追加模式。如果该文件不存在,它创建并写入一个新的文件。 a+ 打开为追加和读取文件。文件指针在该文件的结束。该文件将为追加模式。如果该文件不存在,它创建并读取和写入的新文件。 ab+ 打开两个追加和读取的二进制格式的文件。文件指针在该文件的结束。该文件将在追加模式。如果该文件不存在,它创建并读取和写入的新文件。 二进制在我们处理图像等信息时使用比较多,而其他部分在我们操作字符串等内容比较多。 简单的示例: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 示例文件内容: 我曾经问个不休你何时跟我走 可你却总是笑我一无所有 我要给你我的追求还有我的自由 可你却总是笑我一无所有 噢你何时跟我走 噢你何时跟我走 脚下的地在走身边的水在流 可你却总是笑我一无所有 为何你总笑个没够为何我总要追求 难道在你面前我永远是一无所有 Processfinishedwithexitcode 0 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) readline = a_File.read() print (readline) 结果: 我曾经问个不休你何时跟我走 可你却总是笑我一无所有 我要给你我的追求还有我的自由 可你却总是笑我一无所有 噢你何时跟我走 噢你何时跟我走 脚下的地在走身边的水在流 可你却总是笑我一无所有 为何你总笑个没够为何我总要追求 难道在你面前我永远是一无所有 上面使用的r模式打开,我们采取尝试写入文件,写入内容为字符串openstack\nMYSQLDBA #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) readline = a_File.read() print (readline) a_File.write( "openstack\nMYSQLDBA" ) a_File.close() 结果:文件不可写 Traceback(mostrecentcalllast): File "D:/project/myapp/hello.py" ,line 6 , in <module> a_File.write( "openstack\nMYSQLDBA" ) io.UnsupportedOperation: not writable 我们再尝试用二进制方式打开文件查看内容: #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "rb" ) #去掉了编码格式 readline = a_File.read() print (readline) #a_File.write("openstack\nMYSQLDBA") a_File.close() 结果: b'\xe6\x88\x91\xe6\x9b\xbe\xe7\xbb\x8f\xe9\x97\xae\xe4\xb8\xaa\xe4\xb8\x8d\xe4\xbc\x91\xe4\xbd\xa0\xe4\xbd\x95\xe 其他内容繁多,因此不再演示其他的mode模式 在研究完我们如何将文件打开后,我们就要考虑如何处理打开的文件,主要涉及到文件对象的一些方法。 序号 方法以及描述与应用 1 open()可以创建一个对象打开某个文件,这一部分涉及内容比较多,下一部分介绍,打开的方式以及编码格式等 2 file.close()关闭文件 关闭文件后不能再进行读写操作 3 file.read([size])从文件读取指定的字节数,要是未指定或为负则读取所有 4 file.readline([size])读取整行包括”\n”换行 5 file.readlines()读取文件里的所有行并返回列表,若sizeint>0返回总行约为sizeint字节的行,实际读取的值可能比sizeint较大,因为需要缓冲区 6 file.next()返回文件下一行 7 file.isatty()如果文件连接一个终端设备返回Ture 否则返回False 8 file.flush()刷新文件内部缓冲,直接把内部缓存区的数据写入文件,而不是被动的等待输出缓存区写入 9 file.fileno()返回一个整型的文件描述符(file descriptor FD)可以用在os模块的read方法等的底层操作 10 file.seek(offset[whencr])设置文件的当前位置 11 file.tell()返回文件的当前位置 12 file.truncate([size])截取文件,截取的字节通过size指定,默认当前位置开始 13 file.write(str)将字符串写入文件没有返回值 14 file.writelines(sequence)向文件写入一个序列字符串列表,如果需要换行则需要自己加入换行符 下面根据不同的方法做简单介绍以及相关示例 读操作:读的有file.read() filereadline() filereadlies()等三种方法 1、file.read()方法 里面的参数是size,表示从文件中读取size大小字节,当默认为空或者为负值时表示读取所有的字节, 示例: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果1" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.read( - 1 )) 结果: ###############################################测试结果1################################################ 我曾经问个不休你何时跟我走 可你却总是笑我一无所有 我要给你我的追求还有我的自由 可你却总是笑我一无所有 噢你何时跟我走 噢你何时跟我走 脚下的地在走身边的水在流 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果2" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.read()) 结果: ###############################################测试结果2################################################ 我曾经问个不休你何时跟我走 可你却总是笑我一无所有 我要给你我的追求还有我的自由 可你却总是笑我一无所有 噢你何时跟我走 噢你何时跟我走 脚下的地在走身边的水在流 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果3" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.read( 3 )) 结果: ###############################################测试结果3################################################ 我曾经 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果4" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.read( 15 )) 结果: ###############################################测试结果4################################################ 我曾经问个不休你何时跟我走 可以发现read方法是受字节数量控制的,字节数量的控制影响其输出 2、readline()方法 读取整行包括”\n”换行,参数也是[size]控制,其和read()的区别就是当readline()某行中的字符不够时,只读取改行,而read()会读取其他行的内容。 示例(两者的区别) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果1" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.read( 50 )) print ( "测试结果2" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readline( 100 )) 结果: ###############################################测试结果1################################################ 我曾经问个不休你何时跟我走 可你却总是笑我一无所有 我要给你我的追求还有我的自由 可你却总是笑 ###############################################测试结果2################################################ 我一无所有 readline()方法默认值和负值的相关示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果1" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readline()) print ( "测试结果2" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readline( - 1 )) print ( "测试结果3" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readline( 4 )) print ( "测试结果4" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readline( 10 )) 结果: ###############################################测试结果1################################################ 我曾经问个不休你何时跟我走 ###############################################测试结果2################################################ 可你却总是笑我一无所有 ###############################################测试结果3################################################ 我要给你 ###############################################测试结果4################################################ 我的追求还有我的自 3、readlines()取文件里的所有行并返回列表,若sizeint>0返回总行约为sizeint字节的行,实际读取的值可能比sizeint较大,因为需要缓冲区。则读取指定长度的字节, 并且将这些字节按行分割。 例如: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果1" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readlines( 14 )) ###############################################测试结果1################################################ [ '我曾经问个不休你何时跟我走\n' ] #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile.txt" , "r" ,encoding = 'utf-8' ) #readline=a_File.read(1) print ( "测试结果1" .center( 100 , '#' ))#为了更好的展现测试结果分割 print (a_File.readlines( 14 )) [ '我曾经问个不休你何时跟我走\n' , '可你却总是笑我一无所有\n' ] 当我们设置sizeint值大于行中的字符时才能显示其他行的内容 4、file.close() 关闭文件 关闭文件后不能再进行读写操作文件对象的close()方法刷新未写入的信息,并关闭该文件的对象,在这之后没有数据内容可以执行写入。 Python自动关闭,当文件的引用对象被重新分配给另外一个文件。它是使用close()方法来关闭文件是一个很好的做法。 1 2 3 4 5 6 7 8 9 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile2.txt" , "w+" ) #readline=a_File.read(1) a_File.write( "winnerlookopenatck" ) a_File.close() 将文件写入 写入内容: winnerlookopenatck 5、flie.write() write()方法写入字符串到任何一个打开的文件。要注意的是Python字符串可以具有二进制数据,而不仅仅是文字。 write()方法不要将换行字符(' ')添加到字符串的结尾。在文件关闭前或缓冲区刷新前,字符串内容存储在缓冲区中,这时你在文件中是看不到写入的内容。 例如: 1 2 3 4 5 6 #!/usr/bin/envpython #_*_coding:utf-8_*_ a_File = open ( "D:\\pythonfile2.txt" , "w+" ) #readline=a_File.read(1) a_File.write( "winnerlookopenatck" ) a_File.close() 6、file.writelines() file.writelines()方法用于向文件中写入一序列的字符串。这一序列字符串可以是由迭代对象产生的,如一个字符串列表。换行需要制定换行符 \n。 1 2 3 4 5 6 7 8 9 10 11 12 13 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] #定义列表 a_File = open ( "D:\\pythonfile2.txt" , "w+" ) #readline=a_File.read(1) a_File.writelines(sed) a_File.close() 结果: openstack: 1 docker 2 mysqlDBA 3 KVM 4 7、file.flush() flush() 方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区,不需要是被动的等待输出缓冲区写入。 一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。没有返回值 例如 1 2 3 4 5 6 7 8 9 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] a_File = open ( "D:\\pythonfile2.txt" , "w+" ) #readline=a_File.read(1) a_File.writelines(sed) a_File.flush() a_File.close() 8、file.next() next() 方法在文件使用迭代器时会使用到,在循环中,next()方法会在每次循环中调用,该方法返回文件的下一行,如果到达结尾(EOF),则触发StopIteration 示例: 1 2 3 4 5 6 7 8 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] aFile = open ( "D:\\pythonfile2.txt" , "w+" ) for index in range ( 3 ): line = next (aFile) print ( "第%d行-%s" % (index,line)) 9、file.tell() file.tell()方法返回文件的当前位置,即文件指针当前位置。 语法: 1 fileObject.tell(offset[,whence]) 返回值当前文件指针 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] aFile = open ( "D:\\pythonfile.txt" , "r" ,encoding = "utf-8" ) print (aFile.readline( 30 )) print (aFile.tell()) 我曾经问个不休你何时跟我走我曾经问个不休你何时跟我走我曾 86 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] aFile = open ( "D:\\pythonfile.txt" , "r" ,encoding = "utf-8" ) print (aFile.readline()) print (aFile.tell()) 我曾经问个不休你何时跟我走我曾经问个不休你何时跟我走我曾经问个不休你何时跟我走我曾经问个不休你何时跟我走 162 10、file.isatty() file.isatty()方法检测文件是否连接到一个终端设备,如果是返回 True,否则返回 False 用法: fileObject.isatty() #!/usr/bin/envpython #_*_coding:utf-8_*_ sed=["openstack:1\n","docker2\n","mysqlDBA3\n","KVM4\n"] aFile=open("D:\\pythonfile.txt","r",encoding="utf-8") print(aFile.isatty()) False 11、file.seek() seek() 方法用于移动文件读取指针到指定位置,没有返回值 seek() 方法语法如下: fileObject.seek(offset[,whence]) offset -- 开始的偏移量,也就是代表需要移动偏移的字节数 whence:可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] aFile = open ( "D:\\pythonfile.txt" , "r" ,encoding = "utf-8" ) print (aFile.readline( 10 )) print (aFile.readline( 10 )) aFile.seek( 0 , 0 ) #设置起始位置为0 print (aFile.readline( 10 )) 结果: 我曾经问个不休你何 时跟我走我曾经问个不 我曾经问个不休你何 总结打印完第一行后,下次打印从上次的位置接上,而重新设置其位置后在开始位置打印 12、file.fileno() 方法返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。返回值为一个文件描述符: 1 2 3 4 5 6 7 8 9 #!/usr/bin/envpython #_*_coding:utf-8_*_ sed = [ "openstack:1\n" , "docker2\n" , "mysqlDBA3\n" , "KVM4\n" ] aFile = open ( "D:\\pythonfile.txt" , "r" ,encoding = "utf-8" ) print (aFile.fileno()) 结果: 3 13、file.truncate() truncate() 方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符。 如果没有指定 size,则从当前位置起截断;截断之后 size 后面的所有字符被删除 truncate() 方法语法如下: fileObject.truncate([size]) 参数 本文转自 tianya1993 51CTO博客,原文链接:http://blog.51cto.com/dreamlinux/1910955,如需转载请自行联系原作者