Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1]   Вниз
  Печать  
Автор Тема: Как обработать текст с помощью STL?  (Прочитано 6505 раз)
0 Пользователей и 2 Гостей смотрят эту тему.
ary
Гость
« : 03-05-2006 09:35 » 

имеется текстовый файл.
задача:
1.подсчитать словарный запас,используемый в тексте-т.е. количество слов в тексте без учета повторных употреблений данного слова.
2.частоту употребления каждого слова.
все это желательно сделать с помощью STL.
Понятно ,что для 1-й задачи надо использовать std::set
но вот вопрос,имеется ли функция STL ,позволяющая отличать отдельные слова в техте-или надо писать свою функцию для этого?
Заранее спасибо за помощь и подсказки.
Записан
npak
Команда клуба

ru
Offline Offline
Пол: Мужской

« Ответ #1 : 03-05-2006 12:38 » 

Вот пример решения
Код:
#include <iostream>
#include <sstream>
#include <iterator>
#include <algorithm>
#include <map>
using namespace std;

// Частотный словарь
typedef map<string, int> frequency_dictionary;

// Разобрать текст из входного потока и занести слова в словарь
void parse_text(frequency_dictionary& dict, istream & instream)
{
    string word_with_delims;
    // оператор >> для строк читает слова и игнорирует пробелы
    while(instream >> word_with_delims)
    {
        // в word_with_delims находится последовательность символов без
        // пробелов.  В ней может оказаться несколько слов, разделённых
        // небуквенными символами.  Разделяем строку и заносим каждое слово
        // отдельно.
        string::size_type start = 0;
        string::size_type pos;
        do {
            pos = word_with_delims.find_first_of(".,;:()<>[]{}-+=/#&\"*!@#$%^&?", start);
            if (pos == string::npos) pos = word_with_delims.size();
            if (pos - start > 0)
            {
                ++ dict[word_with_delims.substr(start, pos-start)];
            }
            start = pos+1;
        } while(start < word_with_delims.size());
    }
}

// строит строку вида "слово: число вхождений"
string word_freq(const frequency_dictionary::value_type & p)
{
    ostringstream ssbuf;
    ssbuf << p.first << ": " << p.second;
    return ssbuf.str();
}

// Распечатывает частотный словарь в поток вывода.
ostream & operator<< (ostream & out_stream, const frequency_dictionary & dict)
{
    transform(dict.begin(), dict.end(),
              ostream_iterator<string, char>(out_stream, "\n"),
              word_freq
        );
}

int main(int argc, char ** argv)
{
    frequency_dictionary dict;
    parse_text(dict, cin);
    cout << dict;
    int x = 100;
    return 0;
}
« Последнее редактирование: 03-05-2006 12:41 от npak » Записан

UniTesK -- индустриальная технология надежного тестирования.

http://www.unitesk.com/ru/
Страниц: [1]   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines