当我用Python-docx处理word文件时,可能是扫描到某些特殊字符系统无法解析,系统报错

原创 140阅读 · 时间2019年4月15日 16:21

错误信息:

ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

在这里给大家提供一种解决方式,利用正则表达式,将这些特殊字符给替换掉

re.sub(u'[^\u0020-\uD7FF\u0009\u000A\u000D\uE000-\uFFFD\U00010000-\U0010FFFF]+', '', text)

问题解决。


评论

人生苦短,我学Python!

相关文章推荐 ?
近七日热文推荐 !
回到顶部