Форум программистов «Весельчак У»
Добро пожаловать,
Гость
. Пожалуйста,
войдите
или
зарегистрируйтесь
.
Вам не пришло
письмо с кодом активации?
1 час
1 день
1 неделя
1 месяц
Навсегда
Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
Начало
Наши сайты
Галерея
Весельчак У
Наша Вики
Хранилище
Проекты
Правила
Правила форума
Правила русского языка
Помощь
Поиск
Календарь
Почта
Войти
Регистрация
Форум программистов «Весельчак У»
>
Программирование
>
Общий
(Модератор:
Вад
) > Тема:
Проверка орфографии
Страниц: [
1
]
Вниз
« предыдущая тема
следующая тема »
Печать
Автор
Тема: Проверка орфографии (Прочитано 11302 раз)
0 Пользователей и 4 Гостей смотрят эту тему.
OxCom
Интересующийся
Offline
Пол:
Неуч
Проверка орфографии
«
:
25-11-2010 18:58 »
Всем доброго времени суток.
Все началось с гугла. С его функции исправления ошибок и опечаток в поисковых запросах. Мне стало очень интересно, как современные системы проверяют орфографию. Интересует конкретно алгоритм: по пунктам как и что делается. Плевать на реализацию. Хочу знать как оно работает.
Все что смог найти интересного, но пока не могу понять как оно может мне помочь, так это алгоритм Стемминга для русского языка (Russian stemming algorithm). После я зарылся глубже в поисковики, но без результатов.
По моим размышлениям необходимо посчитать расстояние между словами. Как это можно сделать - должны быть методы, но ничего пока хорошего не нашел. Подскажите куда копать?
«
Последнее редактирование: 25-11-2010 19:32 от OxCom
»
Записан
RXL
Технический
Администратор
Offline
Пол:
Re: Проверка орфографии
«
Ответ #1 :
25-11-2010 19:39 »
Гугль это может делать чисто статистически: во введенном запросе он обнаруживает слово, которое редко встречается в его базе или вообще не встречается и подыскивает ему возможную замену. Поводом для перестройки запроса может быть и малое число ссылок в выдаче, плохая их релевантность или или их протухлость. При их масштабах статистика — вполне годный инструмент. Т.е. пользователи сами обучают систему.
Для более приземленных вариантов: посмотри готовые спелчекеры.
Записан
... мы преодолеваем эту трудность без синтеза распределенных прототипов. (с) Жуков М.С.
Вад
Модератор
Offline
Пол:
Re: Проверка орфографии
«
Ответ #2 :
26-11-2010 06:49 »
Питер Норвиг (ныне, кстати, работающий в Гугле) какое-то время назад написал статью на сабж:
http://norvig.com/spell-correct.html
Разумеется, здесь он изложил наивный подход, но даже этот наивный подход, в общем-то, работает. В конце он приводит ссылки для дальнейшего ознакомления
Как отправная точка - думаю, пойдёт.
«
Последнее редактирование: 26-11-2010 06:51 от Вад
»
Записан
Falsehood
Молодой специалист
Offline
Пол:
не может быть
Re: Проверка орфографии
«
Ответ #3 :
08-12-2010 15:13 »
http://habrahabr.ru/blogs/algorithm/105450/
- интересная статья про проверку орфографии
Записан
Sla
Команда клуба
Offline
Пол:
Re: Проверка орфографии
«
Ответ #4 :
08-12-2010 15:16 »
на хабре еще есть цикл статей в блоге finereader'а
Записан
Мы все учились понемногу... Чему-нибудь и как-нибудь.
Страниц: [
1
]
Вверх
Печать
« предыдущая тема
следующая тема »
Форум программистов «Весельчак У»
>
Программирование
>
Общий
(Модератор:
Вад
) > Тема:
Проверка орфографии
Загружается...