当前位置:Linux教程 - Linux - 神奇的VIM

神奇的VIM

闫石 ([email protected])
工程师

当今世界,文本编辑器种类繁多,大有""乱花渐欲迷人眼""之势。中国有句古语:手巧不如家什妙,作为IT业的专业人士,选择一款优秀的编辑软件至关重要。笔者认为:LINUX下的VIM※以其强大的功能和无穷的魅力将使您终生受益。
由于被广泛移植,无论是PC机的DOS和WINDOWS,还是RISC/6000的AIX,乃至于IBM的大型机S/390,都能见到VIM的身影。然而,对于初学者,VIM的用户界面与使用方法非常不符合常规,甚至认为它比较混乱,无所适从。事实上,VIM编辑器是专门为经验丰富的用户设计的,它的界面和使用方法提供了更快的速度和更强的功能。对于熟知它的用户,VIM的许多特性节省了时间和击键次数,并可以完成一些其他编辑器无法完成的功能。

学习的最好方法是实践,唯有如此,才能真正掌握其中的精髓。文中列举的实例,都是笔者在实际工作中遇到的,具有一定的代表性,请大家在阅读的过程中仔细体会。

好了,现在让我们共同畅游神奇的VIM的世界!

例一、两个常用的指令序列


xp 左右交换光标处两字符的位置。
ddp 上下交换光标处两行的位置。
例二、重复输入同一字符

有时,我们可能想多次输入同一字符,VIM的插入功能可以很好的完成这项工作

命令 80i=^ESC 一次可以输入80个字符= ,当然,80a=^ESC 也可以完成上述功能。

请注意:此处的^ESC表示键盘左上方上的ESC键。

例三、将两个文本数据文件按行逐条合并,并给出标尺

数据文件1内容如下:
1-----
2-----
3-----

数据文件2内容如下:
1=====
2=====
3=====

要求的结果如下:
|--------1---------2---------3---------4---------5
1-----
1=====
|--------1---------2---------3---------4---------5
2-----
2=====
|--------1---------2---------3---------4---------5
3-----
3=====

也许您会说,这还不简单,无非是反复拷贝、粘贴,任何一款文本编辑器都能完成上述功能。可是,如果这两个文件都很大,每个文件都成千上万行,恐怕简单的拷贝、粘贴就难以胜任了。因此,我们所关心的,是找到一种行之有效的方法,把枯燥乏味的工作留给计算机,我们只需发布指令。为达到此目的,请按以下步骤执行:

㈠、将两文件合并,结果如下
1-----
2-----
3-----
1=====
2=====
3=====

㈡、在两文件头尾相接的地方插入标志行,用以区分两个文件,本文采用的是一整行!字符
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
1=====
2=====
3=====

㈢、在标志行的下方输入标尺
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

㈣、执行宏命令脚本merge_2r.vim,即在VIM编辑器中按如下键 :so merge_2r.vim 回车

㈤、按下键盘上的=键,执行的结果如下
|--------1---------2---------3---------4---------5
1-----
1=====
|--------1---------2---------3---------4---------5
2-----
2=====
|--------1---------2---------3---------4---------5
3-----
3=====
|--------1---------2---------3---------4---------5
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5

㈥、将最后三行删除,即可得到我们需要的结果
|--------1---------2---------3---------4---------5
1-----
1=====
|--------1---------2---------3---------4---------5
2-----
2=====
|--------1---------2---------3---------4---------5
3-----
3=====

怎么样,简单吗?请大家自己实际尝试一下。下面,我来详细讲解宏命令脚本merge_2r.vim 。

该脚本内容如下:


""--------------------------------------------------------------------
""Macro Function : Merge File1 And File2,Have Ruler in every record
"" Date : 2001/12/01
"" Author : Yan Shi
""--------------------------------------------------------------------
""1-----
""2----- } Sample File1
""3-----
""!!!!!!!!!!!!!!!!!!!!!!!! Flag Row
""|--------1---------2---------3---------4---------5 Ruler
""1=====
""2===== } Sample File2
""3=====
""--------------------------------------------------------------------
:1
:map = ma/!!!!!^M+:.co ''a-1^M/!!!!!^M2+:.m''a^M+=




前14行每行都以""开始,表明该行是注释行,实际并不执行,只是方便读者阅读,只有最后两行才是真正的代码行。请注意:本例中的^M表示键盘上的回车键,并非^和M两个字符。为了讲述清楚,我把命令行分解开,逐一说明。

首先将第一行置为当前行,然后执行map命令,将一大串VIM指令映像给字符=。这一大串VIM指令共分9步执行:

ma 将数据文件一的第一行标记为a
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

/!!!!!^M 找到标志行,置为当前行
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

+ 光标下移一行,即把标尺行置为当前行
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

:.co ''a-1^M 把标尺行复制到标记行(数据文件一的第一行)的上方
|--------1---------2---------3---------4---------5
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

/!!!!!^M 再次找到标志行,置为当前行
|--------1---------2---------3---------4---------5
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====

2+ 光标下移2行,即数据文件二的第一行置为当前行
|--------1---------2---------3---------4---------5
1-----
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
1=====
2=====
3=====


:.m''a^M 把数据文件二的第一行移至标记行的下方
|--------1---------2---------3---------4---------5
1-----
1=====
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
2=====
3=====

+ 光标下移一行,即数据文件一的第二行置为当前行
|--------1---------2---------3---------4---------5
1-----
1=====
2-----
3-----
!!!!!!!!!!!!!!!!!!!!!!!!
|--------1---------2---------3---------4---------5
2=====
3=====

= 这一步很关键,是典型的递归调用,重复完成以上步骤

例四、在文件中置入行号

工作中,我们有时希望把行号置入文件中,而VIM提供的功能 :set nu 只能显示行号,不能编辑或将其置入文件当中,下面的宏命令脚本row_num.vim可以完成此项功能。



""------------------------------------------
""Macro Function : Source File Add Row_Num
"" Date : 2001/12/01
"" Author : Yan Shi
""------------------------------------------
:%s/^/^I/
:$
:let end=line(""."")
:1
""------------------------------------------
:let num=1
:while num<=end
:let line=getline(""."")
:let temp=substitute(line,$,num,"""")
:call setline(""."",temp)
:+
:let num=num+1
:endwhile
""------------------------------------------




请注意:本例中的^I表示键盘上的TAB键,并非^和I两个字符。下面,我针对该宏命令脚本逐一讲解。



:%s/^/^I/ 每一行的行首添加一个TAB字符
:$ 到文件的末行
:let end=line(""."") 末行的行号 ==〉变量 END,函数line的功能是取得指定行的行号,此处参数"".""表示当前行
:1 到文件的首行
""------------------------------------------
:let num=1 1 ==〉计数器
:while num<=end
:let line=getline(""."") 取当前行的内容 ==〉变量 LINE
:let line=substitute(line,$,num,"""") 在变量 LINE 的前面置入行号
:call setline(""."",line) 将变量 LINE 的内容写回当前行
:+ 下移一行
:let num=num+1 计数器加一
:endwhile 循环执行,直到文件结束
""------------------------------------------




有关正则表达式的使用

UNIX/LINUX下的很多工具之所以强大、灵活,关键是因为有了正则文法和元字符,这也是VIM乃至UNIX/LINUX系统的精华所在。正因为使用灵活,因此掌握起来比较吃力,如果不是真正理解,实际运用中会出现千奇百怪的错误。因此,有必要对这部分知识多花些气力。下面结合具体实例讲解。

例五、有一文件,包含某外企的中国员工的资料,首先是姓名,然后是两个空格,其次是15位身份证号码。


zhang.fei 430759701022003
diao.chan 651302801225012
guan.yu 342869680413001
xi.shi 120638780214006
liu.bei 210324650708001




现在,有以下问题需要解决:

按照外国人的习惯,应该是名在前,姓在后。因此,文件中的姓名字段需要修改。
姓与名的首字母应该大写。
根据身份证号码,还可以判断出生年月日,将其作为一个新字段添加。
根据身份证号码,可以判断出性别。若为男性,添加male,若为女性,添加female 。
将男女员工分开,男员工在前,女员工在后。
将各字段数据左对齐
最终结果如下:


Fei.Zhang 430759701022003 1970/10/22 male
Yu.Guan 342869680413001 1968/04/13 male
Bei.Liu 210324650708001 1965/07/08 male
-----------------------------------------------
Chan.Diao 651302801225012 1980/12/25 female
Shi.Xi 120638780214006 1978/02/14 female




为了完成上述功能,只需执行脚本employee.vim ,使用方法为 :so employee.vim 回车即可。

脚本内容如下:



:%s/ / /
:%s/(............)( *)/1/
:%s/([A-Za-z][A-Za-z]*)(.)([A-Za-z][A-Za-z]*)/u32u1/
:%s/$/ xxxxxx/
:%s/([0-9]{6})([0-9]{6})([0-9]{3}) (xxxxxx)/123 2/
:%s/(..)(..)(..)$/191/2/3
:%s/$/ xxxxxx/
:%s/([0-9]{14}[13579])(.*)(xxxxxx)/12male /
:%s/([0-9]{14}[02468])(.*)(xxxxxx)/12female/
:$
:s/.*/&^M-----------------------------------------------
:g/female/.m$




在这个脚本中,使用了大量的正则表达式,这里仅对涉及到的正则表达式做一简要介绍。有关正则表达式的内容相当多,本文不可能占用大量篇幅叙述,请大家谅解。

% 地址范围符号,代表文件中的所有行,作用等同于地址范围 1,$
. 与任意单字符(换行符除外)匹配,例如 y.s 可以匹配 yas y.s 或 y s 等等。
* 与前一字符的0次或多次出现匹配,例如 y*s 可以匹配 yys yyyyys 或 s 等等。
$ 与行尾匹配。
& 代表模式匹配中出现的字符串,例如 s/abc/&def 是把当前行的abc替换成abcdef 。
[] 匹配[]中出现的字符,例如[abc]匹配字符 a,b 或 c ,[a-zA-Z]匹配所有的英文字符。
( ) (和)之间出现的内容可以由 um来替代。
123 替代(和)之间出现的内容。
u 将后续字符串的首字母大写。
{num} 与前一字符的num次出现匹配。


现在,我们对脚本逐条讲解,希望能帮助大家理解正则文法。

⑴:%s/ / /
将文件中每行出现的2个空格替换为10个空格。


zhang.fei 430759701022003
diao.chan 651302801225012
guan.yu 342869680413001
xi.shi 120638780214006
liu.bei 210324650708001




⑵:%s/(............)( *)/1/
保留行首的12个字符,将其余的空格删除,这样,前两个字段就对齐了。


zhang.fei 430759701022003
diao.chan 651302801225012
guan.yu 342869680413001
xi.shi 120638780214006
liu.bei 210324650708001




⑶:%s/([A-Za-z][A-Za-z]*)(.)([A-Za-z][A-Za-z]*)/u32u1/
将文件中每行出现的雇员姓名互换,并将首字母大写。


Fei.Zhang 430759701022003
Chan.Diao 651302801225012
Yu.Guan 342869680413001
Shi.Xi 120638780214006
Bei.Liu 210324650708001




⑷:%s/$/ xxxxxx/
在每一行的行尾添加2个空格和6个x



Fei.Zhang 430759701022003 xxxxxx
Chan.Diao 651302801225012 xxxxxx
Yu.Guan 342869680413001 xxxxxx
Shi.Xi 120638780214006 xxxxxx
Bei.Liu 210324650708001 xxxxxx




⑸:%s/([0-9]{6})([0-9]{6})([0-9]{3}) (xxxxxx)/123 2/
将xxxxxx替换成出生年月日。


Fei.Zhang 430759701022003 701022
Chan.Diao 651302801225012 801225
Yu.Guan 342869680413001 680413
Shi.Xi 120638780214006 780214
Bei.Liu 210324650708001 650708




⑹:%s/(..)(..)(..)$/191/2/3
将年月日用/字符分隔,并在年前添加19。


Fei.Zhang 430759701022003 1970/10/22
Chan.Diao 651302801225012 1980/12/25
Yu.Guan 342869680413001 1968/04/13
Shi.Xi 120638780214006 1978/02/14
Bei.Liu 210324650708001 1965/07/08




⑺:%s/$/ xxxxxx/
在每一行的行尾添加2个空格和6个x


Fei.Zhang 430759701022003 1970/10/22 xxxxxx
Chan.Diao 651302801225012 1980/12/25 xxxxxx
Yu.Guan 342869680413001 1968/04/13 xxxxxx
Shi.Xi 120638780214006 1978/02/14 xxxxxx
Bei.Liu 210324650708001 1965/07/08 xxxxxx




⑻:%s/([0-9]{14}[13579])(.*)(xxxxxx)/12male /
身份证号码末位是奇数的,将xxxxxx替换成male


Fei.Zhang 430759701022003 1970/10/22 male
Chan.Diao 651302801225012 1980/12/25 xxxxxx
Yu.Guan 342869680413001 1968/04/13 male
Shi.Xi 120638780214006 1978/02/14 xxxxxx
Bei.Liu 210324650708001 1965/07/08 male




⑼:%s/([0-9]{14}[02468])(.*)(xxxxxx)/12female/
身份证号码末位是偶数的,将xxxxxx替换成female


Fei.Zhang 430759701022003 1970/10/22 male
Chan.Diao 651302801225012 1980/12/25 female
Yu.Guan 342869680413001 1968/04/13 male
Shi.Xi 120638780214006 1978/02/14 female
Bei.Liu 210324650708001 1965/07/08 male




⑽:$ 到文件的最后一行

⑾:s/.*/&^M-----------------------------------------------
在文件的最末行插入一行 ""-"" 字符。


Fei.Zhang 430759701022003 1970/10/22 male
Chan.Diao 651302801225012 1980/12/25 female
Yu.Guan 342869680413001 1968/04/13 male
Shi.Xi 120638780214006 1978/02/14 female
Bei.Liu 210324650708001 1965/07/08 male
-----------------------------------------------




⑿:g/female/.m$
将所有的女员工记录移至文件尾。


Fei.Zhang 430759701022003 1970/10/22 male
Yu.Guan 342869680413001 1968/04/13 male
Bei.Liu 210324650708001 1965/07/08 male
-----------------------------------------------
Chan.Diao 651302801225012 1980/12/25 female
Shi.Xi 120638780214006 1978/02/14 female




笔者目前正在为某外资公司从事大型机(IBM S/390)的软件开发,一切工作都在TSO环境中进行。为了对编写的程序进行测试,必须准备测试数据。有过大型机开发经验的人会知道,通过TSO,输入字符型数据还可以,如果要输入16进制数据,操作起来很麻烦。因为16进制数是纵向排列的,输入时既不方便,又很容易错位。怎么解决呢?我尝试了几种办法,实际证明,用VIM最方便。

例六、下列数据 1234567890ABCDEF ,将其变成 13579ACE 24680BDF 的形式,这样,数据就可以很方便的粘贴到TSO环境中了。

下面给出宏命令脚本change_d.vim



""----------------------------------------------------
""Macro Function : Convert Char Arrange Direction
""
"" Sample : 40 50 60 ==> 4 5 6
"" 0 0 0
"" Date : 2001/12/01
"" Author : Yan Shi
""----------------------------------------------------
:s/.*/&^M/
:1
:map = malx+$p-``al=




说明如下:



⑴ :s/.*/&^M/ 在数据行下方添加一空行。
⑵ :1 回到文件的首行的首字符。
⑶ :map = malx+$p-``al= 将一大串VIM命令映像给字符=

① ma 将首字符标记为a
② l 光标右移一个字符
③ x 删除光标处字符
④ + 移至下一行
⑤ $ 到行尾
⑥ p 将删除的字符粘贴
⑦ - 回至上一行
⑧ ``a 返回到标记字符处
⑨ l 光标右移一个字符
⑩ = 递归调用,重复以上步骤,直到将该行所有的数据处理完。




上面的这几个实例,展示了VIM强大的文本处理功能,但这远不能覆盖其全貌。VIM的命令很多,而且使用灵活,需要狠下一番气力才能熟练掌握。笔者年龄尚小,经验还很欠缺,希望本文能够起到抛砖引玉的作用。由于时间的原因,上述实例仅在DOS和WINDOWS环境下测试,没有在其他系统下进行进一步的测试,希望各位同行、前辈不吝赐教,谢谢!

※ VIM 意为 VI Improved ,与VI99%向下兼容。而且,VIM提供了许多VI不具备的功能,内置了诸多函数,因此,建议有经验的VI用户对VIM有所了解,您会发现,转向VIM是明智之举。欲查询有关VIM的资料,请参考 http://www.vim.org

注:本文使用 VIM 6.0 版本

作者简介
闫石,工程师。您可以通过电子邮件:[email protected] 或者 [email protected] 和他联系。