当前位置: 技术问答>linux和unix
关于shell过滤字符串的问题
来源: 互联网 发布时间:2016-07-03
本文导语: 以下是hao123网页的源代码: 游戏专区:魔兽世界DNF梦幻西游奥比岛牧场ONWEB2144游戏商业大亨蜀门穿越火线赛尔号口袋精灵2游戏中国5173连连看qq炫舞冒险岛跑跑卡丁车qq飞车诛仙开心农场彩虹岛武林外传神鬼传奇反恐...
以下是hao123网页的源代码:
游戏专区:魔兽世界DNF梦幻西游奥比岛牧场ONWEB2144游戏商业大亨蜀门穿越火线赛尔号口袋精灵2游戏中国5173连连看qq炫舞冒险岛跑跑卡丁车qq飞车诛仙开心农场彩虹岛武林外传神鬼传奇反恐精英ol街头篮球丝路英雄英雄之城更多 »
[/code]
其中包含了很多网址,想写一个shell脚本将网页中包含的网址过滤出来并输出到文件中,将来文件中会是这个样子:
www.fsjoy.coom
csol.tiancity.com
...
请问该如何进行过滤,谢谢~
游戏专区:魔兽世界DNF梦幻西游奥比岛牧场ONWEB2144游戏商业大亨蜀门穿越火线赛尔号口袋精灵2游戏中国5173连连看qq炫舞冒险岛跑跑卡丁车qq飞车诛仙开心农场彩虹岛武林外传神鬼传奇反恐精英ol街头篮球丝路英雄英雄之城更多 »
[/code]
其中包含了很多网址,想写一个shell脚本将网页中包含的网址过滤出来并输出到文件中,将来文件中会是这个样子:
www.fsjoy.coom
csol.tiancity.com
...
请问该如何进行过滤,谢谢~
|
sed 's/>/>|/g' your.txt | tr -s "|" "n" | sed -n -E '/[A-Za-z0-9.]+(com|cn|net)/s//|&|/p' | awk -F "|" '{print $2}'
|
这就正解了 楼主试试