Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1]   Вниз
  Печать  
Автор Тема: подскажите, пожалуйста, источники для изучения парсинга  (Прочитано 8716 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Наташа314
Гость
« : 21-08-2010 10:37 » 

Ребята, подскажите, пожалуйста, литературу для изучения парсинга, начиная с самых азов. Много встреченных ссылок битые или на английские источники (мне-бы по-русски разобраться…), на форумах общаются профи и, очевидное опытным людям, недоступно мне. Необходимо наполнить сайт на Joomla. С чего начать?  Заранее благодарна.
Записан
RXL
Технический
Администратор

ru
Offline Offline
Пол: Мужской

WWW
« Ответ #1 : 21-08-2010 10:43 » 

Наташа314, объясни, какая связь между "литературу для изучения парсинга" и "наполнить сайт на Joomla"?
Записан

... мы преодолеваем эту трудность без синтеза распределенных прототипов. (с) Жуков М.С.
Sla
Модератор

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #2 : 21-08-2010 10:50 » 

RXL, Отпарсить чужой сайт, наполнить контентом свой сайт на джумле.
Чё не понятно? Улыбаюсь



Добавлено через -1, 364 дня, 23 часа, 56 минут и 31 секунду:
Наташа314, а что такое парсинг?

гляди

Название: About Vasya
Автор: Vasya

в этом примере тебе нужно найти  автора, т.е только Vasya
или название..., но так чтобы описатели не участвовали в в результате поиска.

Добавлено через 3 минуты и 7 секунд:
идея для антипарсинга
css
#content1, #content2, #content3 {
}
html
<div id=contentN>

N - формировать рендомно.
Ну... для ламера сканает...
« Последнее редактирование: 21-08-2010 10:57 от Sla » Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
Наташа314
Гость
« Ответ #3 : 21-08-2010 12:06 » 

Ребята, я в программировании «чайник» и в реале спросить не у кого. На вашем форуме этот вопрос рассматривается наиболее спокойно и ёмко. Понимаю, что учиться надо с азов и на хороших примерах.  Joomla – немного знакома, поэтому делаю на ней.
Из истории вопроса. Человек расширяет дело, предлагает поработать в своей местности, создав собственный сайт с использованием материалов с его сайта. Сам  даже е-почты не имеет, говорит – мол, копируй из сети…  :dontknow:Перегонять порядка 1200 файлов – до морковкина заговения, особенно, если подтачивать под себя всего-ничего.
Помогите, пожалуйста. Улыбаюсь
Записан
Sla
Модератор

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #4 : 21-08-2010 12:55 » 

давай вместе Улыбаюсь

адрес можешь как в личку, так и сюда

Добавлено через 6 часов, 17 минут и 39 секунд:
М-да...
Наташа! я выложу сюда...

Исходный по адресу:www.aist-yalta.com
Копировала сайт к себе на ПК и, вот, интересно: HTTrack Website Copier – преобразует странички любого сайта в хтмл-формат (уж точно статичные), а Offline Explorer Pro –интересующий сайт сохранил как: default.htm, набор index.php@action=, папочки – admin (что особенно интересно, даже логин и пароль запрашивает), templates и upload (с фото, основной вес, почему-то не все доступны для просмотра). Копия результата скачивания по адресу:  http://narod.ru/disk/23946922000/1.rar.html
В дримвивере обрабатывается только главная страница, а остальные, по ссылкам сохраняют прежний вид шаблона. Т.е. – не однозначно как-то…

Я с удовольствием помогу, но только начиная со среды. Государство нам дарит три выходных  и грех ими не воспользоваться.

Тебя, как я понимаю, интересует информация, которая находится
в этой области

<table class="tdet left">
.......................
</table>

Теперь твоя задача  выделить тест межу двумя строками
и это буде парсинг, в самом простейшем его виде.

« Последнее редактирование: 21-08-2010 19:12 от Sla » Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
Наташа314
Гость
« Ответ #5 : 27-08-2010 10:53 » 

Доброго времени суток, Sla!
Надеюсь, хорошо отдохнули.
Немного покопалась в скачанных страничках, есть некоторые забавности. В топе шаблона стоит два рисунка с адресами: file://localhost/E:/download/www.aist-yalta.com/templates/aist/img/logo.gif и file://localhost/E:/download/www.aist-yalta.com/templates/aist/img/phones.gif, но в указанной папке только второй. Почему не видно logo? Файлы типа index.php@action=detalis&id=47 по сути обычные хтмл-странички, видны ли такие поисковикам, как давать на них удобные ссылки?
Записан
Sla
Модератор

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #6 : 27-08-2010 11:18 » new

ой давай по порядку, не смешивай все в кучу.

Отдохнул - великолепно https://forum.shelek.ru/index.php/topic,14397.msg242241.html#msg242241

Цитата
Файлы типа index.php@action=detalis&id=47 по сути обычные хтмл-странички, видны ли такие поисковикам, как давать на них удобные ссылки?
А какие это должны быть странички? Внутри - html.
Если тебе дадут сахар и назовут его солью, то от этого он солью не станет.
И вот тут     index.php@action=detalis&id=47 у тебя ошибка
должно быть типа такого  index.php?action=detalis&id=47
Так это сделано и у аиста.

В свое время ходили слухи, что поисковики плохо индексируют динамические страницы. Сейчас они даже и не замечают этого.
Есть такое понятие как ЧПУ (человеко понятный URL). Задача его в том чтобы типа по телефону человек записывал бы адрес страницы и не парился с различного рода "вопросами и амперсандами"
почитать об этом http://ru.wikipedia.org/wiki/%D0%A7%D0%9F%D0%A3_%28%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%29
Но это не та тема, которая тебя интересует.

Цитата
В топе шаблона стоит два рисунка с адресами: file://localhost/E:/download/www.aist-yalta.com/templates/aist/img/logo.gif и file://localhost/E:/download/www.aist-yalta.com/templates/aist/img/phones.gif, но в указанной папке только второй. Почему не видно logo?
Боюсь неправильно тебя понять.
приглашаю в чат  https://forum.shelek.ru/channels/index.php



 

Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
Страниц: [1]   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines