Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1]   Вниз
  Печать  
Автор Тема: Морфологический анализ текстов...  (Прочитано 14556 раз)
0 Пользователей и 4 Гостей смотрят эту тему.
PoMkA
Гость
« : 25-08-2005 09:59 » 

Привет.
Помогите найти информацию (алгоритмы, коды, статьи, книги - всё что угодно) о морфологическом анализе текста. Его разбиении на главы, абзацы, предложения, слова.
Записан
Finch
Спокойный
Администратор

il
Offline Offline
Пол: Мужской
Пролетал мимо


« Ответ #1 : 25-08-2005 12:02 » 

Чтобы разбить текст на слова и предложения, тут нет ничего сложного, Так как есть явные маркеры концовки. На главы и абзаци это уже из области Искуственного интелекта. Так как такие разбиения не подвержены ни каким логическим правилам. В Word  обычно ставитcя маркеры окончания абзаца и главы. И человек сам вручную проставляет их.
Чтобы делать разбор текста на слова, обычно применяют конечные автоматы. Тут http://www.softcraft.ru/index.shtml  довольно большая подборка статей по конечным автоматам.
Записан

Не будите спашяго дракона.
             Джаффар (Коша)
LEON
Гость
« Ответ #2 : 25-08-2005 19:04 » 

На http://club.shelek.ru есть книги Ахо, Ульмана по синтаксическому анализу. Если нужно больше информации 8) то могу еще несколько книг подкинуть Улыбаюсь
Записан
Finch
Спокойный
Администратор

il
Offline Offline
Пол: Мужской
Пролетал мимо


« Ответ #3 : 25-08-2005 19:36 » 

Какой текст ты хочеш разбирать. Если произвольный текст, например художественное произведение. То книга Ахо тут хотя и поможет но не до конца. Так как она нацелена на создание Компиляторов
Записан

Не будите спашяго дракона.
             Джаффар (Коша)
PoMkA
Гость
« Ответ #4 : 29-08-2005 09:47 » 

Текст обычный, абсолютно из любой тематической среды.
Теория компиляторов не совсем годна.
На слова и педложения разбивка проста, я знаю Ага - не стал бы интересоваться, если бы только это хотел узнать.
За ссылки и книги спасибо - всё посмотрю.

P.S. Если кому интересно, то есть несколько методов логического разбиения текста на абзацы - один из них это по содержанию каждого предложения и соседнего с ним анализируется их связь и выноситься решение - один это смысловой абзац или нет.
Записан
Finch
Спокойный
Администратор

il
Offline Offline
Пол: Мужской
Пролетал мимо


« Ответ #5 : 29-08-2005 11:07 » 

Ромка, мне просто интересно, как ты будеш разбивать на абзаци книги достопочтенного графа Льва Толстого. Там некоторые его предложения потянут на абзац.
Можеш провести эксперемент: Взять любой текст страници на три, убрать все абзаци. Т.е. получится сплошной текст без разметки. И дать своим друзьям разбить на абзаци. 99,9% уверен, что результаты будут разные и многие отличные от оригинала.
« Последнее редактирование: 29-08-2005 12:51 от Finch » Записан

Не будите спашяго дракона.
             Джаффар (Коша)
PoMkA
Гость
« Ответ #6 : 30-08-2005 07:52 » new

Конечно, всё так и будет. Это ведь не точное разбиение, всего лишь приближенное.
Записан
Alf
Гость
« Ответ #7 : 30-08-2005 08:02 » 

IMHO если 10 человек дают 10 разных решений одной и той же задачи и при этом все 10 решений приемлемы, значит, для ее решения достаточно генератора случайных чисел. И Ахи с Ульманами тут никаким боком не применимы.
Записан
Страниц: [1]   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines