四种常见文本文件编码方式ANSI编码:无文件头(文件编码开头标志性)

2023-12-01    分类: 网站建设

php字符编码转换类,支持ANSI、big、UTF-8、UTF-8+bom相互转换。

四种常见的文本文件编码方式

ANSI 编码:

无文件头(文件编码开头的有效字节)

ANSI编码的字母数字占一个字节,汉字占两个字节

回车换行,单字节,十六进制表示为0d 0a

编码:

文件头,十六进制表示为FF FE

每个字符用两个字节编码

回车,换行,双字节,十六进制表示为000d 000a

大编码:

文件头的十六进制表示为FE FF

后面的编码就是把字符的高位放在前面,低位放在后面,正好是编码的逆过程

回车,换行php转unicode编码,双字节php转unicode编码,十六进制表示为 0d00 0a00

UTF-8 编码:

文件头,十六进制表示为EF bb bF

UTF-8 是一种可变长度的字符编码。数字、字母、回车、换行都用1个字节表示,汉字占3个字节。

回车换行,单字节,十六进制表示为0d 0a

转换原则:先将字符编码转换为UTF-8,再由UTF-8转换为对应的字符编码。

..php

_allow_charset)){
            $this->_in_charset = $in_charset;
        }
        // 检查输出编码
        if(in_array($out_charset, $this->_allow_charset)){
            $this->_out_charset = $out_charset;
        }
    }
    /** 转换
    * @param  String $str 要转换的字符串
    * @return String      转换后的字符串
    */
    public function convert($str){
        $str = $this->convToUtf8($str);   // 先转为utf8
        $str = $this->convFromUtf8($str); // 从utf8转为对应的编码
        return $str;
    }
    /** 把编码转为UTF-8编码
    * @param  String $str 
    * @return String
    */
    private function convToUtf8($str){
        if($this->_in_charset=='utf-8'){ // 编码已经是utf-8,不用转
            return $str;
        }
        switch($this->_in_charset){
            case 'utf-8bom':
                $str = substr($str, 3);
                break;
            case 'ansi':
                $str = iconv('GbK', 'UTF-8//IGNORE', $str);
                break;
            case 'unicode':
                $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));
                break;
            case 'unicodebe':
                $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));
                break;
            default:
                break;
        }
        return $str;
    }
    /** 把UTF-8编码转换为输出编码
    * @param  String $str
    * @return String
    */
    private function convFromUtf8($str){
        if($this->_out_charset=='utf-8'){ // 输出编码已经是utf-8,不用转
            return $str;
        }
        switch($this->_out_charset){
            case 'utf-8bom':
                $str = "\xef\xbb\xbf".$str;
                break;
            case 'ansi':
                $str = iconv('UTF-8', 'GbK//IGNORE', $str);
                break;
            case 'unicode':
                $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);
                break;
            case 'unicodebe':
                $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);
                break;
            default:
                break;
        }
        return $str;
    }
} // class end
?>

演示:将 big 转换为 utf-8+bom

convert($str);
file_put_contents('response/utf-8bom.txt', $response, true);
?>

源码下载地址:点击查看

以上介绍了pHp字符编码转换类,支持ANSI、big、UTF-8、UTF-8+bom之间的转换,包括内容,希望对pHp教程感兴趣的朋友有所帮助.

免责声明:本文首发于php中文网。转载请注明出处。感谢您的尊重!如果您有任何问题,请联系我们

网页题目:四种常见文本文件编码方式ANSI编码:无文件头(文件编码开头标志性)
当前地址:https://www.cdcxhl.com/news48/297848.html

成都网站建设公司_创新互联,为您提供小程序开发Google网站建设电子商务面包屑导航移动网站建设

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

商城网站建设