Да, количество текстов постоянно.
опишу наверно, как я себе это представляю и параллельно постараюсь ответить на ваши вопросы.
Есть некая база текстов + аннотации к каждому стандартной структуры (включает позиции паспорта текста: автор, название, время создания, объем, тип, тематика, ключевые слова; непосредственно саму аннотацию ). В каком формате представлены тексты и аннотации (сейчас это ворд), значения нет. К этой базе нужен какой-то пользовательский интерфейс (возможно ли размещение на сайте?), позволяющий делать 2 вида поиска:
1й - если пользователь хочет найти текст по названию. программа выводит текст и его английский эквивалент. да, для этого будет достаточно открыть текст
2й - пользователь вводит ключевые слова (которые есть в аннотации к каждому тексту). программа ищет все контексты с введенным ключевым словом и выводит на экран все найденные в таком виде: выделенное ключевое слово и допустим 5-10 словоупотреблений слева и семь справа + название теста, где найден контекст.
пример того, чего я описываю во 2ом поиске:
http://lexicol.philol.msu.ru/?q=%F0%E5%E1%E5%ED%EE%EA&wtype=wordform&stype=str&len=10&constfeat=all&changefeat=all&zhenre=all&zhenretype=all это из корпусной лингвистики.
ответила как смогла, как понимаю