每天进步一点点:字符串拆分(string split)

in #split7 years ago

做程序的时候遇到一个问题,我想把一个句子按空格拆分成几个关键字,比如说"keyword1 keyword2 keyword3"拆分成"keyword1""keyword2""keyword3",这样便于我组合SQL查询语句。


(图源 :pixabay)

在Python和PHP里,这是很容易的事情,Python中使用split, PHP中使用explode就可以胜任,当然了,还有其它按正则表达式等拆分,就不在我们这篇文章讨论的范畴了。

我的实现

在确认string 并没有现成split或者explode函数之后,就只能考虑自己去写了。找来找去,一个find()一个substr(),似乎可以用这两个完成。

于是乎写了如下函数:

#include <iostream>
#include <string>
#include <vector>
using namespace std;
const vector<string> split(const string& s, const string str)
{
    vector<string> v;
    size_t pos=0, pos1=0;
    string sub;
    while (true) {
        pos = s.find(str, pos1);
        if (pos == string::npos) {
            break;
        }
        sub = s.substr(pos1, pos - pos1);
        if (!sub.empty())
            v.push_back(sub);
        pos1 = pos + 1;
    }
    sub = s.substr(pos1,-1);
    if (!sub.empty())
        v.push_back(sub);
    return v;
}

这个函数兼顾了首尾多余的分隔符,试了一下貌似挺好用。

int main()
{
    string str = "   the  quick brown     fox  jumps over the  lazy dog     ";
    vector<string> v = split(str, " ");
    for (auto n : v) cout << n << endl;
    return 0;
}

然而突然想到,因为我的程序中用到的是空格分隔,所以惯性的把偏移量加一,如果不是用空格作为分隔符,加1已不是就不对了?

比如输入改成:

string str = "::: the quick brown::: fox jumps over::: the lazy dog :::";

用上述函数就全乱套鸟。所以需要把上述代码略作修改比如把pos1 = pos + 1;改成pos1 = pos + str.size();就可以了。

运行结果如下:

他人实现

实现一

在这里发现一个有意思的实现:
http://www.cplusplus.com/articles/2wA0RXSz/

vector<string> explode(const string& s, const char& c)
{
    string buff{""};
    vector<string> v;
    for(auto n:s){
        if(n != c) buff+=n; else
        if(n == c && buff != "") { v.push_back(buff); buff = ""; }
    }
    if(buff != "") v.push_back(buff);
    return v;
}

他的做法相当于按字符直接扫描字符串,但是这个函数遇到多个字节的分隔符,就无能为力了。另外他的函数中没有处理连续分隔符(当然了,可能这也是种需要)。

实现二

另外一种方法使用的stringstream,这玩意我从来没用过,试了一下很好用,倒是涨姿势了。

vector<string> split(const string &s, char delim) {
    stringstream ss(s);
    string item;
    vector<string> tokens;
    while (getline(ss, item, delim)) {
            if (!item.empty())
            tokens.push_back(item);
    }
    return tokens;
}

不过实现一里提及的问题,这里依然存在。

实现三(N)

当我快写完这篇文章时,我发现了How to split a string in C++

链接中的文章里边讲的很详细,并且提供了很多方法,比如使用boost::split

感兴趣的去看看吧,我是懒得去读了,毕竟我的需求已经满足了呢。

参考链接

Sort:  

嗯,你干脆在这里开个班教编程好了。

I think your posts are always one of those best ones l find always..even though not able to read all..thanks @oflyhigh

Hahah good post

看到vector,忘了如何写了哈哈。太久没写C++,等下eos出了,又要温习了。。。

java 中就是 substring 函数了

完全看不懂呢,好像挺厲害的

想用C写可是写了半天写不出东西 (╯‵□′)╯︵┻━┻

突然觉得有Python的split()人生真美好QAQ

技术活,赞赞