(18)Powershell中的字符串拆分运算符

时间:2017-01-14 23:23:36   收藏:0   阅读:5527

    Powershell中提供了对字符串的拆分操作运算符。-split 运算符将一个字符串拆分成多个字符串。 


拆分运算符

    拆分运算符用于将一个或多个字符串拆分为多个子字符串。可更改拆分操作的以下元素:

(1)定界符。默认为空白,但是可指定字符、字符串、模式或用于设置定界符的脚本块。

(2)子字符串的最大数目。默认设置为返回所有子字符串。如果指定的数字小于子字符串数,则其余子字符串将合并到最后一个子字符串中。

(3)用于指定定界符匹配条件的选项,如 SimpleMatch 和 Multiline。

    拆分运算符的语法如下(3种语法,意味着有三种使用方式):

-Split <String>
<String> -Split <Delimiter>[,<Max-substrings>[,"<Options>"]]
<String> -Split {<ScriptBlock>} [,<Max-substrings>]

    需要注意的是,该运算符中没有参数的名称,只包含参数的值。所以参数值必须按语法中指定的顺序出现。-Split 运算有区分大小的格式(默认不区分大小写),-iSplit 运算符不区分大小写。-cSplit 运算符区分大小写,这意味着应用定界符规则时会考虑大小写。

    下面对 -Split 运算符的参数举例说明。

<String>

    指定要拆分的一个或多个字符串。如果是多个字符串,则使用给定的相同的分隔符来分割所有的字符串。例如:

PS D:\> -Split "abc def ghi"
abc
def
ghi

<Delimiter>

    分隔符,用于标识子字符串结束位置的字符(即用什么将一个字符串分割成多个子字符串)。默认定界符是空白,包括空格以及如换行符 (`n) 和制表符 (`t) 等不可打印字符。拆分字符串时,将从所有子字符串中省略定界符。例如:

PS D:\> "ab:cd:ef" -split ":"
ab
cd
ef

<Max-substrings>

    可选参数,指定返回的子字符串的最大数目。默认设置为通过定界符拆分出的所有子字符串。如果子字符串数目大于最大数目,多出的子字符串将合并到最后一个子字符串中。如果子字符串数目小于最大数目,将返回所有子字符串。使用 0 值或负值时将返回所有子字符串。

    如果向拆分运算符提交多个字符串(一组字符串),Max-substrings 限制将单独应用于每个字符串。例如:

PS D:\> $a = "Monday,Tuesday,Wesday,Thurday,Friday,Saturday,Sunday"
PS D:\> $a -split ",", 4
Monday
Tuesday
Wesday
Thurday,Friday,Saturday,Sunday

    需要注意的是参数之间是拿逗号隔开的。

<Options>

    该参数仅当语句中使用 <Max-substrings> 参数时选项才有效,需要请将选项名称括在引号内。

Options 参数的语法为:

"SimpleMatch [,IgnoreCase]"
"[RegexMatch] [,IgnoreCase] [,CultureInvariant][,IgnorePatternWhitespace][,ExplicitCapture][,Singleline | ,Multiline]"


SimpleMatch 选项为: 

(1)SimpleMatch:计算定界符时使用简单字符串比较。不可与 RegexMatch 一起使用。

(2)IgnoreCase:强制进行不区分大小写的匹配,即使指定 -cSplit 运算符也如此。

RegexMatch 选项为

(1)RegexMatch:使用正则表达式匹配来计算定界符。这是默认行为。不可与 SimpleMatch 一起使用。

(2)IgnoreCase:强制进行不区分大小写的匹配,即使指定 -cSplit 运算符也如此。

(3)CultureInvariant:在计算定界符时忽略语言上的区域性差异。仅当与 RegexMatch 一起使用时有效。

(4)IgnorePatternWhitespace:忽略未转义空白以及使用井号 (#) 标记的注释。仅当与RegexMatch 一起使用时有效。

(5)Multiline:使用 Multiline 模式可识别行和字符串的开头和结尾。仅当与 RegexMatch 一起使用时有效。默认设置为 Singleline。

(6)Singleline:使用 Singleline 模式只识别字符串的开头和结尾。仅当与 RegexMatch 一起使用时有效。默认设置为 Singleline。

(7)ExplicitCapture:忽略未命名的匹配组,以便仅在结果列表中返回显式捕获组。仅当与RegexMatch 一起使用时有效。

<ScriptBlock>

    用于指定定界符应用规则的表达式。该表达式的计算结果必须是 $true 或 $false。脚本块需放在大括号中。例如:

PS D:\> $a = "Monday,Tuesday,Wesday,Thurday,Friday,Saturday,Sunday"
PS D:\> $a -split {$_ -eq "n" -or $_ -eq "r"}
Mo
day,Tuesday,Wesday,Thu
day,F
iday,Satu
day,Su
day

    从上面的语句可以看出,在指定的字符串中查找指定的分隔符(本例中的是"n"或者"r"),查找到就执行分隔操作。


2. 一元和二元拆分运算符

    -split <string> 这种格式称为一元拆分运算符,它的优先级高于逗号。即,如果向一元拆分运算符提交逗号分隔的字符串列表,那么会只拆分第一个字符串(第一个逗号之前的部分)。例如:

PS D:\> -split "a b","c d"
a
b
c d

    <string> -split <delimiter> 这种格式称为二元拆分运算符。可将所有字符串都括在圆括号内,或将这些字符串存储在变量中,然后向拆分运算符提交该变量。例如:

PS D:\> "a b","c d" -split " "
a
b
c
d
PS D:\> -split ("a b","c d")
a
b
c
d
PS D:\> $a = "a b","c d"
PS D:\> -split $a
a
b
c
d

总结

    Powershell中的拆分运算符可以对指定的字符串进行分隔,意味着可以截取字符串中的指定部分,这往往用于对时间格式的截取,或是截取文件名并进行模糊查找。


本文出自 “花开花落” 博客,谢绝转载!

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!