现在AI发展迅速,我们做网站也要利用好这个工具。今天在训练AI的时候,我把一个TXT文件到知识库时,一直上传不了,只好用python程序平分分成了几份,但是上传文件到后面还是有一部分失败。那就只能把后面的再分成更小的文件上传,于是就要找到已经上传的给删掉。实现代码如下:
def delete_before_first_occurrence(input_file, output_file, sentence): with open(input_file, 'r', encoding='utf-8') as file: content = file.read() # 找到第一次出现句子的位置 index = content.find(sentence) if index != -1: # 删除句子之前的所有内容 content = content[index:] else: print(f"句子 '{sentence}' 未在文件中找到。") return # 将修改后的内容写回文件 with open(output_file, 'w', encoding='utf-8') as file: file.write(content) # 使用函数 input_txt_file = '高中资料.txt' # 输入文件名 output_txt_file = '高中资料n.txt' # 输出文件名,也可以是原文件名以覆盖原文件 sentence_to_find = '二是考虑到第一志愿考生入学后专业思想稳定' delete_before_first_occurrence(input_txt_file, output_txt_file, sentence_to_find)
请注意以下几点:
你需要替换input_txt_file和output_txt_file为你实际的文件名。如果你想覆盖原文件,可以将output_txt_file设置为和input_txt_file相同的值。
sentence_to_find应该设置为你想要找到并删除其前所有内容的句子。
这个脚本假设你的文本文件是UTF-8编码的。如果文件的编码不同,请相应地修改encoding参数。
find()方法返回的是子字符串第一次出现的索引位置,如果没有找到则返回-1。如果找到,我们就从该位置开始保留文本内容。
这个脚本不会保留句子之前可能出现的任何换行符或其他空白字符。如果需要保留,可以在content[index:]之后添加适当的逻辑来处理这些字符。
在运行此脚本之前,请确保你有文件的备份,以防万一发生意外情况导致数据丢失。
未经允许不得转载:445IT之家 » python程序实现:删除指定句子前所有信息