import re from opencc import OpenCC t2s_converter = OpenCC('t2s') s2t_converter = OpenCC('s2t') EMOJI_PATTERN = re.compile( "[" "\U0001F600-\U0001F64F" # Emoticons "]+", flags=re.UNICODE ) # 创建一个翻译表,用于替换和移除字符 TRANSLATION_TABLE = str.maketrans({ '-': ' ', # 将 '-' 替换为空格 ',': None, '.': None, ',': None, '。': None, '!': None, '!': None, '?': None, '?': None, '…': None, ';': None, ';': None, ':': None, ':': None, '\u3000': ' ', # 将全角空格替换为空格 }) # 替换括号中的内容,包括中括号和小括号 BACKSLASH_PATTERN = re.compile(r'\(.*?\)|\[.*?\]') SPACE_PATTERN = re.compile('(?