怎么删除文件开头的UTF8 BOM

Bom 是指文件开头的三个连续字节. 0xEF 0xBB 0xBF.
所以我们只要匹配并处理字就可以了.

PHP代码如下

1
2
$bom = pack('H*','EFBBBF');
$text = preg_replace("/^$bom/", '', $text);

Python代码如下:

1
2
3
4
5
import codes

if line[:3] == codecs.BOM_UTF8:
print('BOM')
line = line[3:]