Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1]   Вниз
  Печать  
Автор Тема: Найти повторяющиеся слова в тексте, не зная какие именно слова могут повторяться  (Прочитано 16018 раз)
0 Пользователей и 1 Гость смотрят эту тему.
klaus
Участник

ua
Offline Offline

« : 27-11-2009 10:00 » 

И подсветить их, что-ли, или в список вывести... даже не знаю что лучше и с чего начать. Касается ворда. Суть - потом вручную убрать дубли, заменив на синонимы.
« Последнее редактирование: 27-11-2009 10:29 от klaus » Записан
Алексей++
глобальный и пушистый
Глобальный модератор

ru
Offline Offline
Сообщений: 13


« Ответ #1 : 27-11-2009 10:13 » 

а смысл задачи ? Вернее - что понимается под "слова повторяются" ?
Записан

Джон
просто
Администратор

de
Offline Offline
Пол: Мужской

« Ответ #2 : 27-11-2009 10:22 » 

Лёш, например:

В хороший денёк я вышел с хорошим настроением из дома. Погода стояла хорошая. Я хорошо погулял, нагуляв хороший аппетит. За обедом я съел тарелку хороших щей и на душе стало хорошо и спокойно.
...
Записан

Я вам что? Дурак? По выходным и праздникам на работе работать. По выходным и праздникам я работаю дома.
"Just because the language allows you to do something does not mean that it’s the correct thing to do." Trey Nash
"Physics is like sex: sure, it may give some practical results, but that's not why we do it." Richard P. Feynman
"All science is either physics or stamp collecting." Ernest Rutherford
"Wer will, findet Wege, wer nicht will, findet Gründe."
klaus
Участник

ua
Offline Offline

« Ответ #3 : 27-11-2009 10:28 » 

Лёш, например:

В хороший денёк я вышел с хорошим настроением из дома. Погода стояла хорошая. Я хорошо погулял, нагуляв хороший аппетит. За обедом я съел тарелку хороших щей и на душе стало хорошо и спокойно.
...
Вы очень точно описали суть. Нужно вычитать несколько отчетов по 200 страниц, глаза повылазят...
Записан
Sla
Команда клуба

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #4 : 27-11-2009 13:22 » 

для начала использовать объекты Sections, Paragraphs, Sentences, Words.
Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
zubr
Гость
« Ответ #5 : 27-11-2009 18:28 » 

Задача не проста, имхо. Наиболее простой способ - использовать объект Find, но не совсем корректный, так как не будет учитывать однокоренные слова. К примеру, если для поиска будет задано слово "хороший" то слово "хорошая" в результаты поиска не попадет.
Тут надо каким то образом словарь русского языка подключать (или в виде БД, если он в БД, или возможно используя, программу-переводчик, если она имеет COM-интерфейс, про вариант самостоятельного вбивания словаря в БД я молчу), чтобы идентифицировать однокоренные слова.
Записан
klaus
Участник

ua
Offline Offline

« Ответ #6 : 01-12-2009 07:10 » 

Печально это все звучит как-то. А готового решения нигде ни в какой программе не встречали? Похожий алгоритм, я заметил, есть в сервисах для поика плагиата, в нете, но там немножко не то и не так...
Записан
Sla
Команда клуба

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #7 : 01-12-2009 07:28 » 

klaus, а в чем проблема?
Да, тут надо приложить голову.
Но сначала нужно сделать что-то свое.
Чтобы получить доступ ко всему списку слов, я тебе показал объекты от которых нужно разворачиваться.
Возможно, существует какой-то интерфейс vba с тезариусом.
Но сначала все же нужно получить список слов.
Кроме того, ведь тебе еще нужно оценивать расстояние между словами.
Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
klaus
Участник

ua
Offline Offline

« Ответ #8 : 01-12-2009 07:30 » new

Да, спасибо, - "лучше день потерять, зато потом за час долететь"
Записан
Страниц: [1]   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines