#新玩具# 还是入声字,刚得到了大批纯文本,却带来一个大问题:里面会出现各种不可预知的字符或符号,有没有办法通过unicode把这些字符筛出去呢?比如有没有一套通用标准,留下其中某一部分,其他全都筛出去?刚才试了只留下基本库和扩展A,好像不太成功的样子,暂时没时间深入下去,总之求指教 赞[1] 转发[1] 评论[1] 收藏 置顶 删除
#新玩具# 还是入声字,刚得到了大批纯文本,却带来一个大问题:里面会出现各种不可预知的字符或符号,有没有办法通过unicode把这些字符筛出去呢?比如有没有一套通用标准,留下其中某一部分,其他全都筛出去?刚才试了只留下基本库和扩展A,好像不太成功的样子,暂时没时间深入下去,总之求指教 赞[1] 转发[1] 评论[1] 收藏 置顶 删除