当前位置: 技术问答>linux和unix
在线求教awk的一个问题,关于FS和RS!
来源: 互联网 发布时间:2016-11-20
本文导语: 有一段文本的格式是: 19980101-01-001-001/m 文本 19980101-01-001-002/m 文本 19980101-01-001-003/m 文本 19980101-01-001-004/m 文本 19980101-01-002-001/m 文本 19980101-01-002-002/m 文本 19980101-02-001-001/m 文本 19980101-02-001-002/m 文...
有一段文本的格式是:
19980101-01-001-001/m 文本
19980101-01-001-002/m 文本
19980101-01-001-003/m 文本
19980101-01-001-004/m 文本
19980101-01-002-001/m 文本
19980101-01-002-002/m 文本
19980101-02-001-001/m 文本
19980101-02-001-002/m 文本
19980101-02-001-003/m 文本
……
我希望将每段文本单独提取出来存放在一个文件内,段与段之间是用空行分隔的。
最开始我设置的FS=“N”,RS=“”,按照书上所述RS=“”是以空行来分隔一个记录的,也就是能将上面的文本一段一段的分离出来。但是结果并不是这样的,我的脚本是这样写的:
FILENAME=".txt"
BEGIN
{
FS = "n";
RS = "";
}
{
FILENAME = NR FILENAME
for(i = 1; i > FILENAME;
}
}
执行命令:awk -f test.awk ../test > /dev/null
其中../test是输入文件,命令执行的结果是只生成了一个和输入文件内容相同的文件1.txt。
似乎用空行来分隔记录没有效果,我将RS或FS换成"[0-9]{8}-[0-9]{2}-[0-9]{3}-001"也没有用,但是结果是为文件中的每一行生成了一个文件。
用了几个小时都没解决这个问题,希望高手赐教!
19980101-01-001-001/m 文本
19980101-01-001-002/m 文本
19980101-01-001-003/m 文本
19980101-01-001-004/m 文本
19980101-01-002-001/m 文本
19980101-01-002-002/m 文本
19980101-02-001-001/m 文本
19980101-02-001-002/m 文本
19980101-02-001-003/m 文本
……
我希望将每段文本单独提取出来存放在一个文件内,段与段之间是用空行分隔的。
最开始我设置的FS=“N”,RS=“”,按照书上所述RS=“”是以空行来分隔一个记录的,也就是能将上面的文本一段一段的分离出来。但是结果并不是这样的,我的脚本是这样写的:
FILENAME=".txt"
BEGIN
{
FS = "n";
RS = "";
}
{
FILENAME = NR FILENAME
for(i = 1; i > FILENAME;
}
}
执行命令:awk -f test.awk ../test > /dev/null
其中../test是输入文件,命令执行的结果是只生成了一个和输入文件内容相同的文件1.txt。
似乎用空行来分隔记录没有效果,我将RS或FS换成"[0-9]{8}-[0-9]{2}-[0-9]{3}-001"也没有用,但是结果是为文件中的每一行生成了一个文件。
用了几个小时都没解决这个问题,希望高手赐教!
|
把首行的 FILENAME=".txt" 去掉
awk脚本中变量不能这么定义,否则将无条件的输出文件原始内容
BEGIN {
FS = "n";
RS = "";
}
{ for(i = 1; i > NR ".txt";
}
}
awk脚本中变量不能这么定义,否则将无条件的输出文件原始内容
BEGIN {
FS = "n";
RS = "";
}
{ for(i = 1; i > NR ".txt";
}
}
|
你是想解决掉这个问题,还是想弄清楚awk的一些东东。
如果是前者,那么你可以使用简单的shell写个小循环来解决,如果是后者,在下就爱莫能助了。我基本上使用perl处理文本,不用awk。
如果是前者,那么你可以使用简单的shell写个小循环来解决,如果是后者,在下就爱莫能助了。我基本上使用perl处理文本,不用awk。
|
awk 'BEGIN{RS=""}{for(i=1;i i".txt"}}'