python删除大文件中的某一行(最有效率的方法)

脚本专栏 python 分类:[default] 更新日期: 2016-10-28
下面小编就为大家带来一篇python 删除大文件中的某一行最有效率的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

用 python 处理一个文本时,想要删除其中中某一行,常规的思路是先把文件读入内存,在内存中修改后再写入源文件。

但如果要处理一个很大的文本,比如GB级别的文本时,这种方法不仅需要占用很大内存,而且一次性读入内存时耗费时间,还有可能导致内存溢出。

所以,需要用另外一个思路去处理。

我们可以使用 open() 方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行时,用后面的行逐一覆盖。实现方式见以下代码。

with open('file.txt', 'r') as old_file:
 with open('file.txt', 'r+') as new_file:

  current_line = 0

  # 定位到需要删除的行
  while current_line < (del_line - 1):
   old_file.readline()
   current_line += 1

  # 当前光标在被删除行的行首,记录该位置
  seek_point = old_file.tell()

  # 设置光标位置
  new_file.seek(seek_point, 0)

  # 读需要删除的行,光标移到下一行行首
  old_file.readline()
  
  # 被删除行的下一行读给 next_line
  next_line = old_file.readline()

  # 连续覆盖剩余行,后面所有行上移一行
  while next_line:
   new_file.write(next_line)
   next_line = old_file.readline()

  # 写完最后一行后截断文件,因为删除操作,文件整体少了一行,原文件最后一行需要去掉
  new_file.truncate()

以上这篇python 删除大文件里的某一行(最有效率的方法)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。


> 本站内容系网友提交或本网编辑转载,其目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时与本网联系,我们将在第一时间删除内容!

相关文章
 • Jquery和BigFileUpload实现大文件上传及进度条显示
  Jquery和BigFileUpload实现大文件上传及进度条显示
  这篇文章主要介绍了Jquery和BigFileUpload实现大文件上传及进度条显示的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下实现方法:用到了高山来客 的bigfileupload组件,用高山来客的方法,弹出一个模式窗口,然后不停刷新获取进度,始终觉得体验感不好,于是想到用jquery来实现无刷新进度显示,因为提交页面后, 不能让其刷新页面 ...
 • Python中在脚本中引用其他文件函数的实现方法
  下面小编就为大家带来一篇Python中在脚本中引用其他文件函数的实现方法.小编觉得挺不错的,现在就分享给大家,也给大家做个参考.一起跟随小编过来看看吧在导入文件的时候,Python只搜索当前脚本所在的目录,加载(entry-point)入口脚本运行目录和sys.path中包含的路径例如包的安装地址.所以如果要在当前脚本引用其他文件,除了将文件放在和脚本同一目 ...
 • .NET实现简易的文件增量备份程序
  这篇文章主要介绍了.NET实现简易的文件增量备份程序,需要的朋友可以参考下.Net中提供了许多方便使用的方法,包括在处理文件中查找文件.拷贝文件等,今天实现的是通过简易的程序实现增量的备份文件. 首先需要的是选择备份源文件路径SourcePath和备份目标文件路径DestinationPath,然后通过StopWatch统计拷贝所耗费的时间.(注意:使用St ...
 • asp.netcore实现文件上传功能
  asp.netcore实现文件上传功能
  这篇文章主要为大家详细介绍了asp.net core实现文件上传功能,怎么做单文件和多文件上传,感兴趣的小伙伴们可以参考一下本文实例为大家分享了单文件上传.多文件上传的功能,供大家参考,具体内容如下 单文件上传 上传文件在Web应用程序中是一个常见的功能.在asp.net core中上传文件并保存在服务器上,是很容易的.下面就来演示一下怎么样在 ASP.NE ...
 • python正则表达式学习小结
  这篇文章主要介绍了python 正则表达式学习小结的相关资料,非常不错具有参考借鉴价值,需要的朋友可以参考下 在Python中实现正则的方式是通过re(regular expression的缩写)模块来实现的,你可以调用re模块的各种方法来实现不同的功能,下面我们就来说下,在Python中通过re模块可以调用那些方法,以及这些方法的作用都是什么:还有就是正则 ...
 • asp画中画广告插入在每篇文章中的实现方法
  这篇文章主要介绍了asp画中画广告插入在每篇文章中的实现方法,需要的朋友可以参考下尽管很多人给出了给每篇文章加上画中画广告的方法,但是这些所谓的方法,都不能真正地实现文字环绕在广告周围的"画中画"效果,只能左对其或者右对齐.现在要讨论的这个方法才能真正实现像新浪网.搜狐网那样的画中画广告效果. 首先说一下错误的div+CSS方法,希望大家 ...
猜你喜欢