用Python实现磁盘IO操作全攻略
面主要说一下open函数中的mode参数,通过改变mode参数可以实现对文件的不同操作。
这里主要是提醒一下'b'参数的使用,一般处理文本文件时,是用不到'b'参数的,但处理一些其他类型的文件(二进制文件),比如mp3音乐或者图像,那么应该在模式参数中增加'b',这在爬虫中处理媒体文件很常用。参数'rb'可以用来读取一个二进制文件。 3. 文件缓冲区 open函数中第三个可选参数buffering控制着文件的缓冲。 如果参数是0,I/O操作就是无缓冲的,直接将数据写到硬盘上;如果参数是1,I/O操作就是有缓冲的,数据先写到内存里,只有使用flush函数或者close函数才会将数据更新到硬盘;如果参数为大于1的数字则代表缓冲区的大小(单位是字节),-1(或者是任何负数)代表使用默认缓冲区的大小。 4. 文件读取 文件读取主要是分为按字节读取和按行进行读取,经常用到的方法有read()、readlines()、close()。 在“>>>”输入f = open(r'c:textqiye.txt')后,如果成功打开文本文件,接下来调用read()方法则可以一次性将文件内容全部读到内存中,***返回的是str类型的对象: 代码略长,Python提供了一种简单的写法,使用with语句来替代try ... finally代码块和close()方法,如下所示: with open(r'c:textqiye.txt','r') as fileReader: print fileReader.read() 调用read()一次将文件内容读到内存,但是如果文件过大,将会出现内存不足的问题。一般对于大文件,可以反复调用read(size)方法,一次最多读取size个字节。如果文件是文本文件,Python提供了更加合理的做法,调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回列表。 大家可以根据自己的具体需求采取不同的读取方式,例如小文件可以直接采取read()方法读到内存,大文件更加安全的方式是连续调用read(size),而对于配置文件等文本文件,使用readline()方法更加合理。
将上面的代码进行修改,采用readline()的方式实现如下所示 (编辑:唐山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |