当前位置: 技术问答>linux和unix
求linux命令解决一个文件处理的问题
来源: 互联网 发布时间:2017-05-22
本文导语: 有两份文件, ip.txt是无重复IP列表, access.txt是有重复IP访问列表. 现在要统计ip.txt中IP的访问量, 有什么linux命令或小脚本可以解决问题么? (前提是两个文件都有百万条数据量, 高效为第一要求) 比如输入文件ip.txt的...
有两份文件, ip.txt是无重复IP列表, access.txt是有重复IP访问列表. 现在要统计ip.txt中IP的访问量, 有什么linux命令或小脚本可以解决问题么? (前提是两个文件都有百万条数据量, 高效为第一要求)
比如输入文件ip.txt的内容如下:
192.168.1.100
192.168.1.103
192.168.1.161
access.txt的内容如下:
192.168.1.1
192.168.1.2
192.168.1.161
192.168.1.161
192.168.1.47
192.168.1.161
192.168.1.100
192.168.1.161
192.168.1.1
192.168.1.2
192.168.1.3
输出为5
比如输入文件ip.txt的内容如下:
192.168.1.100
192.168.1.103
192.168.1.161
access.txt的内容如下:
192.168.1.1
192.168.1.2
192.168.1.161
192.168.1.161
192.168.1.47
192.168.1.161
192.168.1.100
192.168.1.161
192.168.1.1
192.168.1.2
192.168.1.3
输出为5
|
分别试试这两个代码需要多长时间:
grep -cxFf ip.txt access.txt
grep -xFf ip.txt access.txt | wc -l
grep -cxFf ip.txt access.txt
grep -xFf ip.txt access.txt | wc -l