玩蛇网提供最新Python编程技术信息以及Python资源下载!

python如何处理中英文混排最长公共前缀问题

比如:
str1 = "我是a good boy" str2 = "我是a bad boy"

两者的公共前缀为:我是a

引自 os.path.commonprefix,参数可以是任意数量的list

def commonprefix(m):
    if not m: return ''
    s1 = min(m)
    s2 = max(m)
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1

commonprefix(['我是a good boy', '我是a bad boy'])

如果只需要两个字符串,可以简化为

def commonprefix(s1, s2):
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1

os.path.commonprefix((str1, str2))

其实我想说,如果楼主强调的是“中英文混排”这件事的话,那么如果两个字符串的同为unicode,或者采用了相同的字节编码方式的话,应该中英文混排这件事其实是没有区别的。

采用unicode时,每个汉字或者每个英文都是一个完整的字符;采用比如utf-8编码时,每个汉字是3个字节,每个英文是一个字节,那么依然不影响前缀的比较

转化為list

def longestprefix(str1, str2):
    if str1 == str2:
        return str1
    return '' if str1[0] != str2[0] else str1[0] + longestprefix(str1[1:], str2[1:])

Python 3.4 测试可以, 2.x 没尝试

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19164.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月24日 - 20时20分42秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules