关于字符串常见的算法

宋嬷嬷
• 阅读 825

欢迎访问我的博客

常见的题目

匹配字符串之kmp

题目来源
思路:
这里使用了一个《部分匹配表》的数据结构
字符串与搜索词依次比较,通过‘移动位数=已知匹配字符串数-对应的部分匹配值’来
移动搜索词。注意这里的移动是指移动字符串的索引位数。
"前缀"指除了最后一个字符以外,一个字符串的全部头部组合
"后缀"指除了第一个字符以外,一个字符串的全部尾部组合
部分匹配值:前缀与后缀的最长的共有元素长度
字符串:‘abcdabd’
前缀:[a, ab, abc, abcd, abcda, abcdb],
后缀: [bcdabd, cdabd, dabd, abd, bd, d]
部分匹配值: 0
字符串:‘abcda’
前缀:[a, ab, abc, abcd],
后缀: [bcda, cda, da, a]
部分匹配值: 1
str: bbc abcdab abcdabcdabde
search: abcdabd
=>
bbc abcdab abcdabcdabde
____abcdabd(4 = 6 - 2)(移动位数=已知匹配字符串数-对应的部分匹配值)
=>
bbc abcdab abcdabcdabde
________abcdabd(2 = 2 - 0)
=>
bbc abcdab abcdabcdabde
__________abcdabd
=>
bbc abcdab abcdabcdabde
___________abcdabd(4 = 6 - 2)
=>
bbc abcdab abcdabcdabde
_______________abcdabd(4 = 6 - 2)
=>
over
// 获取前缀
const getPrefix = str => {
    const arr = str.split('')
    arr.splice(str.length - 1)
    const result = []
    arr.forEach((item, index) => {
        if (index === 0) {
            result.push(item)
        } else {
            result.push(arr.slice(0, index + 1).join(''))
        }
    })
    return result
}
// 获取后缀
const getSuffix = str => {
    const s = str.slice(1)
    const result = []
    for (let key in s) {
        result.push(s.slice(key))
    }
    return result
}
// 获取前缀与后缀的最长公共子集的长度
const commonFix = (prefix, suffix) => {
    let maxLen = 0
    for (let pre of prefix) {
        for (let suff of suffix) {
            if (pre === suff) {
                maxLen = pre.length > maxLen ? pre.length : maxLen
            }
        }
    }
    return maxLen
}
// 得到部分匹配表
const getMatchTable = (str) => {
    const map = new Map()
    for (let i = 0; i < str.length; i++) {
        map.set(i + 1, commonFix(
            getPrefix(str.slice(0, i + 1)),
            getSuffix(str.slice(0, i + 1))
        ))
    }
    return map
}

const match = (str, search) => {
    let matchedLen = 0
    const table = getMatchTable(search)
    let jump = 0
    for (let char of str) {
        if (jump) {
            jump -= 1
            continue
        }
        if (char === search[matchedLen]) {
            matchedLen += 1
            if (matchedLen === search.length) return true
        } else {
            if (matchedLen) {
                // ‘移动位数=已知匹配字符串数-对应的部分匹配值’
                jump = matchedLen - table.get(matchedLen)
                matchedLen = 0
            }
            continue
        }
    }
    return false
}

替换空格

题目来源
const replaceSpace = function (s) {
    return s.split(' ').join('%20')
}

表示数值的字符串

题目来源
思路:使用有限状态自动机
状态自动机:
确定有限状态自动机(以下简称「自动机」)是一类计算模型。它包含一系列状态,这些状态中:
有一个特殊的状态,被称作「初始状态」。
还有一系列状态被称为「接受状态」,它们组成了一个特殊的集合。其中,一个状态可能既是「初始状态」,也是「接受状态」。
起初,这个自动机处于「初始状态」。随后,它顺序地读取字符串中的每一个字符,并根据当前状态和读入的字符,按照某个事先约定好的「转移规则」,从当前状态转移到下一个状态;当状态转移完成后,它就读取下一个字符。当字符串全部读取完毕后,如果自动机处于某个「接受状态」,则判定该字符串「被接受」;否则,判定该字符串「被拒绝
>
> 枚举字符类型:空格 「 」、数字「 0—9 」 、正负号 「 +- 」 、小数点 「 . 」 、幂符号 「 eE 」
按照字符串从左到右的顺序,定义以下 9 种状态。
0: 开始的空格
1: 幂符号前的正负号
2: 小数点前的数字
3: 小数点、小数点后的数字
4: 当小数点前为空格时,小数点、小数点后的数字
5: 幂符号
6: 幂符号后的正负号
7: 幂符号后的数字
8: 结尾的空格
>
> 数值(按顺序)可以分成以下几个部分:
1: 若干空格
2: 一个小数或者整数
3:(可选)一个 'e' 或 'E' ,后面跟着一个整数
4: 若干空格
>
> 小数的定义:
1:(可选)一个符号字符('+' 或 '-')
2: 下述格式之一:
至少一位数字,后面跟着一个点 '.' 比如'1.'
至少一位数字,后面跟着一个点 '.' ,后面再跟着至少一位数字 比如'1.1'
一个点 '.' ,后面跟着至少一位数字 比如'.1'
>
>整数的定义:
1:(可选)一个符号字符('+' 或 '-')
2: 至少一位数字
其中终点为2,3,7,8的状态都是接受状态
*/
// '5.2e-3 '
const CharType = {
    'blank': 'blank',
    'sign': 'sign',
    'digit': 'digit',
    'dot': 'dot',
    'e': 'e',
}
// 状态转移表2, 3, 7
// 状态转移表显示了所有的路线方案
const states = [
    // 0: 开始的空格
    { 'blank': 0, 'sign': 1, 'digit': 2, 'dot': 4 },
    // 1: 幂符号前的正负号
    { 'digit': 2, 'dot': 4 },
    // 2: 小数点前的数字
    { 'digit': 2, 'dot': 3, 'e': 5, 'blank': 0 },
    // 3: 小数点、小数点后的数字
    { 'digit': 3, 'e': 5, 'blank': 8 },
    // 4: 当小数点前为空格时,小数点、小数点后的数字
    { 'digit': 3 },
    // 5: 幂符号
    { 'sign': 6, 'digit': 7 },
    // 6: 幂符号后的正负号
    { 'digit': 7 },
    // 7: 幂符号后的数字
    { 'digit': 7, 'blank': 8 },
    // 8: 结尾的空格
    { 'blank': 8 }
]
const isNumber = s => {
    let p = 0
    let t = ''
    // 状态转移循环
    for (let char of s) {
        if ('0' <= char && '9' >= char) {
            t = 'digit'
        } else if ('+-'.includes(char)) {
            t = 'sign'
        } else if ('eE'.includes(char)) {
            t = 'e'
        } else if (char === '.') {
            t = 'dot'
        } else if (char === ' ') {
            t = 'blank'
        } else {
            t = '?'
        }
        if (!states[p][t]) return false
        p = states[p][t]
    }
    return [2, 3, 7, 8].includes(p)
}

字符串的排列

题目来源
思路:
深度:    选择
depth0: a or b or c
depth1: a or b or c
depth2: a or b or c
depth3: back
const permutation = s => {
    const path = []
    const result = new Set()
    const visited = new Set()
    const dfs = (depth) => {
        if (path.length === s.length) {
            if (!result.has(path.join(''))) {
                result.add(path.join(''))
            }
            return
        }
        for (let i = 0; i < s.length; i++) {
            if (!visited.has(i)) {
                path.push(s[i])
                visited.add(i)
                dfs(depth + 1)
                path.pop()
                visited.delete(i)
            }
        }
    }
    dfs(0)
    return Array.from(result)
}

左旋转字符串

题目来源
const reverseLeftWords = function (s, n) {
    return s.slice(n) + s.slice(0, n)
}
点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Karen110 Karen110
4年前
一篇文章带你了解JavaScript日期
日期对象允许您使用日期(年、月、日、小时、分钟、秒和毫秒)。一、JavaScript的日期格式一个JavaScript日期可以写为一个字符串:ThuFeb02201909:59:51GMT0800(中国标准时间)或者是一个数字:1486000791164写数字的日期,指定的毫秒数自1970年1月1日00:00:00到现在。1\.显示日期使用
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
1年前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
4年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这