关于全角转换为半角的使用问题,其实源自在公司的运营人员在输入法切换的时候选择了全角,结果导致程序有时候没有办法进行解析。 为了避免这样的转换字符问题再次出现,于是就有了将全角转换为半角的问题了。 在这里,全角会对以下内容进行描述: 我们知道在编码中,存储在计算机中仅仅是1个数字,而编码其实充当的是1种转换的过程,如果将1个字符转换为1个数字而问题。 全角和半角 一般情况下,半角普通的英文字符只占用1个字节的空间,而1个字节有8位,因此可以存储256个字符。而汉字、使用日语及朝鲜文字这样CJK的转换字符文字很明显不止256个,因此会使用2个字节来存储。 而在使用英文输入法时,全角我们将1个英文字符所占的位置称为半角。而由于1个汉字占用2个英文字符的半角位置,因为我们将其称为全角。 需要注意的使用是,只有在支持汉字等语言的计算及上才存在全角和半角的概念。另外,转换字符虽然通常情况下的英文字母、数字键及符号键都是全角半角的,但是云南idc服务商为了排列整齐,英文和其他拉丁文的字符和标签也可以使用全角格式。 因此,半角我们知道全角需要占用2个字节,而半角则占用1个字节。 全角转换为半角 在ASCII编码中,使用我们知道可以打印的字符只有127-33=94个。在这里,转换字符我们需要去除del键及ASCII编码表中前32位。 由于半角和全角只是全角占用字节个数的不同,因此全角可打印的字符也是94个。因此这2者之间是存在规律的,比如我们假设半角a字符的在计算机中存储的数字为60,而全角的a字符在计算机中存储的数字为1200。而假设a的下1个字符为b,其存储的数字为61, 那么全角的b字符存储的数字应为1201。 因此,这种一一映射的关系就查看各种规范中是如何定义的了。不同的规范定义会有所不同。 由于在Unicode规定中,半角字符是从33开始,到126结束。而Unicode中全角的编码是源码下载从65281开始到65374结束。 细心的你们会发现,这里少了1个字符,那就是空格。在半角中,空格是32,而在全角中它是12288。 python的实现转换 现在,我们使用python来实现转换的操作,我们会检查给定的字符是否为全角,只有在全角的情况下才进行转换的操作。 在这里,我们对字符串进行遍历,然后判断其字符的大小,如果给定的字符是全角则将其进行减法操作。***将其组装在一起返回就可以了。 然后我们进行如下的测试: 其结果如下所示: 当然,除了以上的方式外,还有其他的方式将全角转换为半角。比如我隔壁那个搞python的哥们直接就用正则进行匹配然后批量的香港云服务器进行转换。 由于我比较懒和能力比较有限,只好通过上面的方式来简化我的工作量。