python程序实现:删除指定句子前所有信息

现在AI发展迅速,我们做网站也要利用好这个工具。今天在训练AI的时候,我把一个TXT文件到知识库时,一直上传不了,只好用python程序平分分成了几份,但是上传文件到后面还是有一部分失败。那就只能把后面的再分成更小的文件上传,于是就要找到已经上传的给删掉。实现代码如下:

def delete_before_first_occurrence(input_file, output_file, sentence):
    with open(input_file, 'r', encoding='utf-8') as file:
        content = file.read()

        # 找到第一次出现句子的位置
    index = content.find(sentence)
    if index != -1:
        # 删除句子之前的所有内容
        content = content[index:]
    else:
        print(f"句子 '{sentence}' 未在文件中找到。")
        return

        # 将修改后的内容写回文件
    with open(output_file, 'w', encoding='utf-8') as file:
        file.write(content)

    # 使用函数


input_txt_file = '高中资料.txt'  # 输入文件名
output_txt_file = '高中资料n.txt'  # 输出文件名,也可以是原文件名以覆盖原文件
sentence_to_find = '二是考虑到第一志愿考生入学后专业思想稳定'

delete_before_first_occurrence(input_txt_file, output_txt_file, sentence_to_find)

请注意以下几点:

你需要替换input_txt_file和output_txt_file为你实际的文件名。如果你想覆盖原文件,可以将output_txt_file设置为和input_txt_file相同的值。

sentence_to_find应该设置为你想要找到并删除其前所有内容的句子。

这个脚本假设你的文本文件是UTF-8编码的。如果文件的编码不同,请相应地修改encoding参数。

find()方法返回的是子字符串第一次出现的索引位置,如果没有找到则返回-1。如果找到,我们就从该位置开始保留文本内容。

这个脚本不会保留句子之前可能出现的任何换行符或其他空白字符。如果需要保留,可以在content[index:]之后添加适当的逻辑来处理这些字符。

在运行此脚本之前,请确保你有文件的备份,以防万一发生意外情况导致数据丢失。

未经允许不得转载:445IT之家 » python程序实现:删除指定句子前所有信息

赞 (0) 打赏

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏