玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容

python ascii格式怎么生成utf-8文件

import codecs

txt = u"\u5e10\u53f7\u4e0d\u5b58\u5728"
file=codecs.open("test","w","utf-8")
file.write(txt)
file.close()

这个可以正确写入
但当string只为ascii字符时,比如

txt = u"qwer"

这时生成的file仍旧为ascii格式
需要怎么做才能生成utf-8格式的文件?
谢谢

写入和读出的时候都用encode和decode处理一下就好

utf-8编码本身是ascii兼容的,所以只有ascii字符的时候,“是否utf-8”编码是没有意义的。

如果要求文件可以被明确识别为utf8编码,则需要在文件头写入几个特殊字符(即UTF-8的BOM),详情参见cute同学的回答。

p.s. 由于文件开头多了几个字符,这时候可能会导致某些应用无法兼容。

我一般都手动编码成str之后再写入的
s = s.encode("utf-8")

bom是微软自己发明的东西~其他系统都不带这个。。。

文件开头加上:

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

import codecs

txt = u"qwer"
file=codecs.open("test","w","utf-8")
file.write(txt)
file.close()

import codecs
txt = u"qwer"
file=codecs.open("test","w","utf-8-sig")
file.write(txt)
file.close()

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/wenda/wd20456.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年06月01日 - 15时11分15秒 发布自玩蛇网

我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules