当前位置: 技术问答>linux和unix
linux text 乱码问题
来源: 互联网 发布时间:2016-11-30
本文导语: 如何过滤掉linux 文本文件中的乱码? 如果一行包含乱码 就把这行删除? 乱码 例: ���������������� ×�×•×“×•×ª×“×•×ž×™×™× ×™×�.com 很多种。。 谢谢 | ...
如何过滤掉linux 文本文件中的乱码?
如果一行包含乱码 就把这行删除?
乱码 例:
����������������
×�×•×“×•×ª×“×•×ž×™×™× ×™×�.com
很多种。。
谢谢
如果一行包含乱码 就把这行删除?
乱码 例:
����������������
×�×•×“×•×ª×“×•×ž×™×™× ×™×�.com
很多种。。
谢谢
|
改成正确的编码格式才是王道
|
如果你单纯想把多字节字删除,就是要判断每个字节的最高位bit,如果是1就可以删了,脚本好像作不到,写个程序很容易。
大家都说得很清楚了,最重要的是编码问题!
大家都说得很清楚了,最重要的是编码问题!
|
你认为什么是乱码呢?你觉得那是乱码只是你的眼睛告诉你的,你的眼睛能告诉cpu哪些是乱码吗?
这位同学你应该去理解一下内码这个概念。
这位同学你应该去理解一下内码这个概念。
|
这个标准不好把握
用od -x 看看你的文件,那些看起来的乱码有没有什么规律?
用od -x 看看你的文件,那些看起来的乱码有没有什么规律?
|
乱码说明,字符编码不对,判断编码范围就可以了
|
只要包含不是0-9 a-z A-Z的行,就删除
|
用的什么编辑器
这个编辑器打开乱码,换一个可能就不乱码了
怎么删
乱码也可能是编辑器问题,系统环境问题...
删还是不用了
找出正确的编码格式才是
这个编辑器打开乱码,换一个可能就不乱码了
怎么删
乱码也可能是编辑器问题,系统环境问题...
删还是不用了
找出正确的编码格式才是
|
乱码只是打开显示用的字符编码集和存储的不相同,改成一致的就可以了