it-swarm.cn

版本号解析的正则表达式

我有以下形式的版本号:

version.release.modification

其中版本,发布和修改是一组数字或'*'通配符。此外,这些数字(以及任何前面的数字)中的任何一个都可能丢失。

所以以下是有效的并解析为:

1.23.456 = version 1, release 23, modification 456
1.23     = version 1, release 23, any modification
1.23.*   = version 1, release 23, any modification
1.*      = version 1, any release, any modification
1        = version 1, any release, any modification
*        = any version, any release, any modification

但这些都无效:

*.12
*123.1
12*
12.*.34

任何人都可以为我提供一个不太复杂的正则表达式来验证和检索版本,版本和修改号码吗?

69
Andrew Borley

我将格式表达为:

“1-3个点分隔的组件,每个数字除了最后一个可能是*”

作为正则表达式,那是:

^(\d+\.)?(\d+\.)?(\*|\d+)$

[编辑添加:此解决方案是一种简洁的验证方式,但有人指出,提取值需要额外的工作。无论是通过使正则表达式复杂化还是通过处理匹配的组来处理这个问题,都是一个品味问题。

在我的解决方案中,组捕获"."字符。这可以使用非捕获组来处理,就像在ajborley的回答中一样。

此外,最右边的组将捕获最后一个组件,即使组件少于三个,因此例如双组件输入导致第一组和最后一组捕获而中间组未定义。我认为这可以由支持的非贪婪团体来处理。

在regexp之后处理这两个问题的Perl代码可能是这样的:

@version = ();
@groups = ($1, $2, $3);
foreach (@groups) {
    next if !defined;
    s/\.//;
    Push @version, $_;
}
($major, $minor, $mod) = (@version, "*", "*");

这与"."上的拆分相比并不短

71
Steve Jessop

使用正则表达式,现在你有两个问题。 我会把东西分成点(“。”),然后确保每个部分都是通配符或一组数字(正则表达式现在是完美的)。如果该东西有效,您只需返回正确的分割块。

38
Paweł Hajdan

这可能有效:

^(\*|\d+(\.\d+){0,2}(\.\*)?)$

在顶层,“*”是有效版本号的特例。否则,它以数字开头。然后有零个,一个或两个“.nn”序列,后跟一个可选的“。*”。此正则表达式将接受1.2.3。*,这可能会或可能不会在您的申请中被允许。

用于检索匹配序列的代码,尤其是(\.\d+){0,2}部分,将取决于您的特定正则表达式库。

11
Greg Hewgill

感谢所有的回复!这是王牌:)

基于OneByOne的答案(对我来说看起来最简单),我添加了一些非捕获组('(?:'部分 - 感谢VonC将我介绍给非捕获组!),因此仅捕获的组包含数字或*字符。

^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$

非常感谢大家!

11
Andrew Borley

不知道你在哪个平台,但在.NET中有System.Version类,它将为你解析“n.n.n.n”版本号。

7
Duncan Smart

我的2美分:我遇到过这种情况:我不得不用字符串文字解析版本号。 (我知道这与原始问题有很大不同,但谷歌搜索找到解析版本号的正则表达式显示此顶部的线程,所以在这里添加这个答案)

所以字符串文字将是这样的:“服务版本1.2.35.564正在运行!”

我不得不解析这个字面上的1.2.35.564。从@ajborley那里得到一个提示,我的正则表达式如下:

(?:(\d+)\.)?(?:(\d+)\.)?(?:(\d+)\.\d+)

一个小的C#片段来测试它如下所示:

void Main()
{
    Regex regEx = new Regex(@"(?:(\d+)\.)?(?:(\d+)\.)?(?:(\d+)\.\d+)", RegexOptions.Compiled);

    Match version = regEx.Match("The Service SuperService 2.1.309.0) is Running!");
    version.Value.Dump("Version using RegEx");   // Prints 2.1.309.0        
}
6
Sudhanshu Mishra

我倾向于同意拆分建议。

我在Perl中为你的问题创建了一个“测试人员”

#!/usr/bin/Perl -w


@strings = ( "1.2.3", "1.2.*", "1.*","*" );

%regexp = ( svrist => qr/(?:(\d+)\.(\d+)\.(\d+)|(\d+)\.(\d+)|(\d+))?(?:\.\*)?/,
            onebyone => qr/^(\d+\.)?(\d+\.)?(\*|\d+)$/,
            greg => qr/^(\*|\d+(\.\d+){0,2}(\.\*)?)$/,
            vonc => qr/^((?:\d+(?!\.\*)\.)+)(\d+)?(\.\*)?$|^(\d+)\.\*$|^(\*|\d+)$/,
            ajb => qr/^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$/,
            jrudolph => qr/^(((\d+)\.)?(\d+)\.)?(\d+|\*)$/
          );

  foreach my $r (keys %regexp){
    my $reg = $regexp{$r};
    print "Using $r regexp\n";
foreach my $s (@strings){
  print "$s : ";

    if ($s =~m/$reg/){
    my ($main, $maj, $min,$rev,$ex1,$ex2,$ex3) = ("any","any","any","any","any","any","any");
    $main = $1 if ($1 && $1 ne "*") ;
    $maj = $2 if ($2 && $2 ne "*") ;
    $min = $3 if ($3 && $3 ne "*") ;
    $rev = $4 if ($4 && $4 ne "*") ;
    $ex1 = $5 if ($5 && $5 ne "*") ;
    $ex2 = $6 if ($6 && $6 ne "*") ;
    $ex3 = $7 if ($7 && $7 ne "*") ;
    print "$main $maj $min $rev $ex1 $ex2 $ex3\n";

  }else{
  print " nomatch\n";
  }
  }
print "------------------------\n";
}

当前输出:

> Perl regex.pl
Using onebyone regexp
1.2.3 : 1. 2. 3 any any any any
1.2.* : 1. 2. any any any any any
1.* : 1. any any any any any any
* : any any any any any any any
------------------------
Using svrist regexp
1.2.3 : 1 2 3 any any any any
1.2.* : any any any 1 2 any any
1.* : any any any any any 1 any
* : any any any any any any any
------------------------
Using vonc regexp
1.2.3 : 1.2. 3 any any any any any
1.2.* : 1. 2 .* any any any any
1.* : any any any 1 any any any
* : any any any any any any any
------------------------
Using ajb regexp
1.2.3 : 1 2 3 any any any any
1.2.* : 1 2 any any any any any
1.* : 1 any any any any any any
* : any any any any any any any
------------------------
Using jrudolph regexp
1.2.3 : 1.2. 1. 1 2 3 any any
1.2.* : 1.2. 1. 1 2 any any any
1.* : 1. any any 1 any any any
* : any any any any any any any
------------------------
Using greg regexp
1.2.3 : 1.2.3 .3 any any any any any
1.2.* : 1.2.* .2 .* any any any any
1.* : 1.* any .* any any any any
* : any any any any any any any
------------------------
5
svrist

这应该适用于您规定的内容。它取决于外卡位置,是一个嵌套的正则表达式:

^((\*)|([0-9]+(\.((\*)|([0-9]+(\.((\*)|([0-9]+)))?)))?))$

http://imgur.com/3E492.png

4
nomuus

我见过很多答案,但是...我有一个新答案。它至少对我有用。我添加了一个新限制。版本号无法启动(主要,次要或补丁),其他任何零后跟。

01.0.0无效1.0.0有效10.0.10有效1.0.0000无效

^(?:(0\\.|([1-9]+\\d*)\\.))+(?:(0\\.|([1-9]+\\d*)\\.))+((0|([1-9]+\\d*)))$

它基于前一个。但我觉得这个解决方案更好......对我来说;)

请享用!!!

4
Israel Romero

另一个尝试:

^(((\d+)\.)?(\d+)\.)?(\d+|\*)$

这给出了组中的三个部分4,5,6但是:它们与右边对齐。因此,第一个非空的4,5或6给出了版本字段。

  • 1.2.3给出1,2,3
  • 1.2。*给出1,2,*
  • 1.2给出null,1,2
  • ***给出null,null,*
  • 1. *给出null,1,*
3
jrudolph
^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$

也许更简洁的可能是:

^(?:(\d+)\.){0,2}(\*|\d+)$

然后可以使用*或{2}而不是{0,2}将其增强到1.2.3.4.5。*或完全限制为X.Y.Z

3
ofaurax

我有一个要求搜索/匹配版本号,遵循maven约定甚至只是一位数。但无论如何都没有限定词。这很特别,我花了很多时间才想到这个:

'^[0-9][0-9.]*$'

这确保了版本,

  1. 从数字开始
  2. 可以有任意数量的数字
  3. 只有数字和'。'被允许

一个缺点是版本甚至可以以“。”结尾。但它可以处理无限长的版本(疯狂的版本控制,如果你想称之为)

火柴:

  • 1.2.3
  • 1.09.5
  • 3.4.4.5.7.8.8。
  • 23.6.209.234.3

如果你对''不满意。结束,可能是你可以结合逻辑结束

3
Shiva

似乎很难有一个完全符合你想要的正则表达式(即只接受你需要的情况并拒绝 所有 others返回三个组件的一些组)。我试一试,想出这个:

^(\*|(\d+(\.(\d+(\.(\d+|\*))?|\*))?))$

IMO(我没有进行过广泛的测试)这应该可以作为输入的验证器正常工作,但问题是这个正则表达式不提供检索组件的方法。为此你仍然需要分期。

这个解决方案不是一体化的,但在编程中大多数时候都不需要。当然,这取决于您在代码中可能具有的其他限制。

2
rslite

请记住,regexp是贪婪的,所以如果你只是在版本号字符串中搜索而不是在更大的文本中搜索,请使用^和$来标记字符串的开头和结尾。来自Greg的正则表达式似乎工作正常(只是在我的编辑器中快速尝试),但根据您的库/语言,第一部分仍然可以匹配错误版本号中的“*”。也许我错过了一些东西,因为我没有使用Regexp一年左右。

这应该确保您只能找到正确的版本号:

^(\ * |。?\ d +(\\d +)*(\\*))$

编辑:实际上greg已经添加了它们甚至改进了他的解决方案,我太慢了:)

2
FrankS
(?ms)^((?:\d+(?!\.\*)\.)+)(\d+)?(\.\*)?$|^(\d+)\.\*$|^(\*|\d+)$

与您的6个第一个示例完全匹配,并拒绝其他4个示例

  • 第1组:主要或主要.minor或'*'
  • 第2组(如果存在):次要或*
  • 第3组(如果存在):*

你可以删除'(?ms)'
我用它来指示这个正则表达式通过 QuickRex应用于多行

2
VonC

指定XSD元素:

<xs:simpleType>
    <xs:restriction base="xs:string">
        <xs:pattern value="[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}(\..*)?"/>
    </xs:restriction>
</xs:simpleType>
2
Emmerson

这也符合1.2.3。*

^(。* |?\ d +(\ d +){0,2}(*))$

我会建议不那么优雅:

(* |\d +(\ d +)(*)。?。?)|。\ d +\d +\d +)

2
Victor

我认为这是一个很好的练习 - vparse ,它有一个 微小的源 ,功能简单:

function parseVersion(v) {
    var m = v.match(/\d*\.|\d+/g) || [];
    v = {
        major: +m[0] || 0,
        minor: +m[1] || 0,
        patch: +m[2] || 0,
        build: +m[3] || 0
    };
    v.isEmpty = !v.major && !v.minor && !v.patch && !v.build;
    v.parsed = [v.major, v.minor, v.patch, v.build];
    v.text = v.parsed.join('.');
    return v;
}
2
vitaly-t

还有一个解决方案

^[1-9][\d]*(.[1-9][\d]*)*(.\*)?|\*$
1
Oleksandr Yarushevskyi