在C++中处理文件读取时,读取标点符号可能会造成一些问题,例如在单词中被错误解析为单独的字符。因此,最好将标点符号视为单独的标记,并且在读取文件时将它们与单词分开处理。
代码示例:
#include
#include
#include
#include
using namespace std;
vector split(string s, char delim)
{
vector tokens;
string token;
size_t start = 0, end = 0;
while ((end = s.find(delim, start)) != string::npos)
{
token = s.substr(start, end - start);
if (!token.empty())
tokens.push_back(token);
start = end + 1;
}
token = s.substr(start);
if (!token.empty())
tokens.push_back(token);
return tokens;
}
int main()
{
ifstream inFile("input.txt");
if (!inFile)
{
cerr << "Unable to open file input.txt";
exit(1);
}
vector words;
string line;
while (getline(inFile, line))
{
vector tokens = split(line, ' ');
for (int i = 0; i < tokens.size(); i++)
{
string word = tokens[i];
if (word.back() == '.' || word.back() == ',' || word.back() == ';')
{
words.push_back(word.substr(0, word.length() - 1));
words.push_back(word.substr(word.length() - 1));
}
else
{
words.push_back(word);
}
}
}
for (int i = 0; i < words.size(); i++)
{
cout << words[i] << " ";
}
cout << endl;
return 0;
}
在这个例子中,我们使用了一个名为split的函数,这个函数将字符串拆分成一个单词的向量。我们在读取每一行时使用这个函数,将每
上一篇:避免在C++模板函数中重复的代码