Дано:
Интернет-магазин. 12 тысяч товаров. Описания на каждый товар в отдельном файле html. Причём файлы эти включают в себя как информацию о товаре, так и оформление. То есть, в случае например необходимости исправить дизайн странички с описанием товара, придётся править вручную отдельно каждую из 12 тысяч страниц.
Вот сам этот интернет-магазин:
http://www.comptorg.ru , если интересно, посмотрите там описание любого товара, выскакивающее в отдельном окошке.
Осознаём, что таким образом содержать информацию о товаре крайне неправильно. Но поступает она именно в таком виде - в файлах html. Параметры у каждого товара свои, то есть, например, про принтер пишут, цветной или чб, лезерный/струйный, скорострельность, а про процессор - тактовая частота, кэш, сокет.
Надо из такой вот кучи файлов html создать нормальную человеческую базу данных, выдрав из файлов полезную информацию.
Как это сделать - у меня пока соображений мало.
Прошу уважаемое сообщество поделиться идеями.