当前位置: 技术问答>linux和unix
江湖救急!!!关于半角字符的问题。
来源: 互联网 发布时间:2017-01-13
本文导语: 有这样一批文本文件,内容大致如下: 999801011003500 !|中国银行债券正回购借入款 !|25403 !|01!|999801011003500!|120000000!|102000000!|999801011003500!|0!|3112143 !|0!|2.3!|0!|0!|20081030!|20081031!|20081031!|2!|2!|1!| 9998010...
有这样一批文本文件,内容大致如下:
999801011003500 !|中国银行债券正回购借入款 !|25403 !|01!|999801011003500!|120000000!|102000000!|999801011003500!|0!|3112143 !|0!|2.3!|0!|0!|20081030!|20081031!|20081031!|2!|2!|1!|
999801011144171 !|浙泰隆商行-信贷资产(买入返售?|1440102!|01!|999801011144171!|90000000!|90000000!|999801011144171!|0!|3020329 !|0!|6.81!|0!|0!|20081031!|20081031!|20090402!|2!|3!|1!|
999801011144189 !|江苏宜兴农信--债券逆回购借出款!|14403 !|01!|999801011144189!|500000000!|500000000!|999801011144189!|0!|3038062 !|0!|2.355!|0!|0!|20081104!|20081105!|20081105!|2!|3!|1!|
注意“买入返售”那里,是一半个中文字符,由于这半个中文字符,把分隔符!|的!吃掉了,导致sqlloader无法导入,各位大侠有什么好的方法可以批量处理没有?文件太多?
我开始以为可以用sed把那种前面没有!号的|替换成!|,但是发现那个?实际上还是有!号的, sed识别不出来。
999801011003500 !|中国银行债券正回购借入款 !|25403 !|01!|999801011003500!|120000000!|102000000!|999801011003500!|0!|3112143 !|0!|2.3!|0!|0!|20081030!|20081031!|20081031!|2!|2!|1!|
999801011144171 !|浙泰隆商行-信贷资产(买入返售?|1440102!|01!|999801011144171!|90000000!|90000000!|999801011144171!|0!|3020329 !|0!|6.81!|0!|0!|20081031!|20081031!|20090402!|2!|3!|1!|
999801011144189 !|江苏宜兴农信--债券逆回购借出款!|14403 !|01!|999801011144189!|500000000!|500000000!|999801011144189!|0!|3038062 !|0!|2.355!|0!|0!|20081104!|20081105!|20081105!|2!|3!|1!|
注意“买入返售”那里,是一半个中文字符,由于这半个中文字符,把分隔符!|的!吃掉了,导致sqlloader无法导入,各位大侠有什么好的方法可以批量处理没有?文件太多?
我开始以为可以用sed把那种前面没有!号的|替换成!|,但是发现那个?实际上还是有!号的, sed识别不出来。
|
文本转成utf-8先?
|
复制了你的文本,似乎是(这个符号是中文字符,其他的都不是。?是英文字符。
|
用OpenOffice或者类似软件可以进行全角半角文字替换
其实记事本或者gedit也可以
|
他的要求应该不是替换?
|
先把格式转换正确吧
set fileformat=unix
set fileformat=unix