КнигоПровод.Ru24.11.2024

/ИТ-книги/O'REILLY

Взломы Web-узлов. 100 профессиональных советов и инструментов. Практическое пособие — Хеменвей К., Калишейн Т.
Взломы Web-узлов. 100 профессиональных советов и инструментов. Практическое пособие
Хеменвей К., Калишейн Т.
год издания — 2006, кол-во страниц — 448, ISBN — 5-7163-0122-3, 0-596-00577-6, тираж — 3000, язык — русский, тип обложки — мягк., масса книги — 580 гр., издательство — СП ЭКОМ
цена: 1000.00 рубПоложить эту книгу в корзину
Kevin Hemenway
Тага Calishain
SPIDERING HACKS
100 Industrial-Strength Tips & Tools

O'REILLY 2005

Пер. с англ.

Формат 70x100 1/16. Бумага офсетная. Печать офсетная
ключевые слова — web-, поиск, данных, веб-, интернет, spiders, scrapers, хакер, разработ, администратор, портал, html, робот, perl, lwp, http, robots, mechanize, регулярн, rss, xpath, wget, рорз, yahoo, google, amazon, ipod, geotaigeting, xml-rpc

Книга представляет собой сборник профессиональных советов и сценариев, позволяющих повысить эффективность поиска и получения данных с веб-серверов и других ресурсов интернета. Рассматриваются следующие темы: создание и использование поисковых и сканирующих роботов (spiders и scrapers), расшифровка и обработка полученных данных, написание скриптов и шаблонов, создание мультимедийных библиотек, философия настоящих хакеров.

Книга рассчитана на разработчиков и администраторов веб-узлов и порталов, а также всех тех, кому приходится много времени проводить, перебирая данные в интернете.

ОГЛАВЛЕНИЕ

Предисловие15
 
Глава 1. Вступление21
 
1. Ускоренный курс глобального поиска в интернете и сбора информации21
2. Наилучшие советы для программиста и его поискового робота24
3. Анатомия HTML-страницы28
4. Регистрация нового поискового робота32
5. Получение права на поиск34
6. Осторожность при использовании поискового робота37
7. Поиск образцов идентификаторов41
 
Глава 2. Подбор комплекта инструментов45
 
8. Инсталляция модулей Perl48
9. Простая выборка с помощью LWP::Simple51
10. Более сложные запросы с помощью LWP::UserAgent53
11. Добавление HTTP-заголовков к запросу55
12. Пересылка данных с помощью LWP56
13. Идентификация, cookies и прокси59
14. Обработка относительных и абсолютных URL64
15. Защищённый доступ и атрибуты браузера66
16. Ограничение пропускной способности68
17. Файл robots.txt72
18. Добавление индикаторов выполнения к пользовательским сценариям73
19. Сбор данных с помощью HTML::TreeBuilder79
20. Синтаксический анализ с помощью HTML::TokeParser83
21. WWW-Mechanize 10186
22. Сбор данных с помощью WWW::Mechanize89
23. Во славу регулярным выражениям94
24. Беспроблемный RSS с помощью Template::Extract97
25. Введение в XPath101
26. Загрузка с помощью curl и wget106
27. Более расширенные методы wget108
28. Использование конвейера для последовательности команд110
29. Одновременное выполнение множества утилит115
30. Использование Web Scraping Proxy119
31. Предупреждайте возникновение проблем123
32. Будьте готовы к реконструкции сайта126
 
Глава 3. Сбор мультимедийных файлов129
 
33. Детективное расследование: Newgrounds129
34. Детективное расследование: iFilm135
35. Загрузка фильмов из библиотеки конгресса139
36. Загрузка изображений с Webshots142
37. Загрузка комиксов с dailystrips146
38. Архивирование изображения с веб-камер149
39. News Wallpaper для своего сайта153
40. Сохранение только РОРЗ вложений в электронной почте157
41. Загрузка МРЗ из списка файлов для воспроизведения164
42. Загрузка из Usenet с помощью nget169
 
Глава 4. Сбор информации из баз данных173
 
43. Архивирование Yahoo! с помощью yahoo2mbox173
44. Архивирование групповых сообщений Yahoo! с помощью
WWW::Yahoo::Groups175
45. Сбор Buzz из Yahoo!180
46. Глобальный поиск в каталоге Yahoo!183
47. Отслеживание добавлений к Yahoo!190
48. Поиск вразброс с помощью Yahoo! и Google193
49. Связь каталогов Yahoo! и Google197
50. Результаты поиска в Google без учёта сетевых журналов202
51. Глобальный поиск в интернете, Google и множественные домены205
52. Сбор рецензий на продукты Amazon.com210
53. Получение почтового предупреждения о недавно добавленных
рецензиях Amazon.com212
54. Сбор клиентских советов Amazon.com215
55. Публикация связанной с Amazon.com статистики217
56. Сортировка отзывов Amazon.com по рейтингу219
57. Связанные с Alexa продукты Amazon.com222
58. Сбор данных Alexa с помощью Java227
59. Обнаружение информации об альбомах с помощью FreeDB и Amazon.com229
60. Расширение музыкальных предпочтений239
61. Сохранение ежедневных гороскопов в пользовательском iPod243
62. Графическое представление данных с помощью RRDTOOL246
63. Сбор финансовых котировок250
64. Поиск информации об авторе254
65. Составление библиотечного каталога бестселлеров O'Reilly270
66. Составление списка книг с помощью All Consuming273
67. Отслеживание посылок FedEx279
68. Проверка онлайновых журналов на наличие новых комментариев282
69. Объединение RSS и отправки изменений по почте287
70. Использование Link Cosmos в Technorati295
71. Обнаружение связанных с RSS данных298
72. Автоматический поиск представляющих интерес онлайновых журналов311
73. Сбор программ телевизионных передач314
74. Какая погода у посетителя сайта?319
75. Определение местоположения хоста с помощью Geotaigeting322
76. Определение наилучшего маршрута для путешествия поездом329
77. Определение географического расстояния332
78. Поиск слов338
79. Поиск словарных ассоциаций с помощью Lexical Freenet343
80. Переформатирование сообщений Bugtraq347
81. Создание закладок в сети с помощью электронной почты352
82. Публикация папки «Избранное» из Internet Explorer на сайте
пользователя358
83. Поиск цен игр в Web GameStop.com367
84. Осуществление сделок с помощью РНР370
85. Объединение результатов нескольких поисковых серверов376
86. Караоке-робот381
87. Поиск компаний с определённым видом услуг385
88. Поиск информации о санитарных инспекциях389
89. Родительский контроль392
 
Глава 5. Обслуживание личных коллекций396
 
90. Использование утилиты cron для автоматизации выполнения задач396
91. Планирование задач без использования cron398
92. Зеркальное копирование сайтов с помощью wget и rsync403
93. Накопление результатов поиска408
 
Глава 6. Доступность личных ресурсов для других пользователей412
 
94. Использование XML::RSS для переназначения данных413
95. Размещение RSS-заголовков на нужном сайте417
96. Доступ к вашим ресурсам с помощью регулярных выражений420
97. Доступ к личным ресурсам с помощью интерфейса REST428
98. Доступ к личным ресурсам с помощью XML-RPC432
99. Создание интерфейса IM436
100. Что дальше?440
 
Указатель443

Книги на ту же тему

  1. Бизнес путь: Yahoo!. Секреты самой популярной в мире интернет-компании, Вламис Э., Смит Б., 2003
  2. Головоломки на PHP для хакера, Кузнецов М. В., Симдянов И. В., 2006
  3. Галактика Интернет: Размышления об Интернете, бизнесе и обществе, Кастельс М., 2004
  4. Разработка приложений для электронной коммерции на Oracle8i и Java, Заккар М., 2000
  5. Perl & XML. Библиотека программиста, Макинтош Д., Рэй Э. Т., 2003
  6. Perl 6 и Parrot: справочник. — 2-е изд., Рэндал Э., Сугальски Д., Тёч Л., 2005
  7. Perl: изучаем глубже. — 2-е изд., Шварц Р. Л., Фой Б., Феникс Т., 2007
  8. CGI/Perl: Создание программ для Web, Пэтчетт К., Райт М., 1999
  9. Perl для системного администрирования, Бланк-Эдельман Д. Н., 2001
  10. Perl-отладчик. Карманный справочник, Фоули Р., 2005
  11. Изучаем Perl, Шварц Р. Л., Кристиансен Т., 1999
  12. CGI программирование на Perl, Гулич С., Гундаварам Ш., Бирзнекс Г., 2001
  13. Регулярные выражения. 2-ое издание, Фридл Д., 2003
  14. Регулярные выражения. Библиотека программиста, Фридл Д., 2001
  15. Perl: Библиотека программиста, Кристиансен Т., Торкингтон Н., 2000
  16. Программирование на Perl DBI, Декарт А., Банс Т., 2000
  17. Регулярные выражения. Карманный справочник, Стаблибайн Т., 2004
  18. Perl. Сборник рецептов. Для профессионалов. 2-е изд., Кристиансен Т., Торкингтон Н., 2004
  19. Тюнинг веб-сервера. — 2-е изд., Киллелиа П., 2003
  20. Создание защиты в Интернете, Цвики Э., Купер С., Чапмен Б., 2002
  21. Анти-хакер. Средства защиты компьютерных сетей. Справочник профессионала, Джонс К. Д., Шема М., Джонсон Б. С., 2003
  22. UNIX. Справочник, Роббинс А., 2007
  23. UNIX. Практическое пособие администратора, Торчинский Ф., 2003
  24. Linux и UNIX: программирование в shell. Руководство разработчика, Тейнсли Д., 2001
  25. Программирование web-сервисов для .NET, Феррара А., Мак-Дональд М., 2003
  26. Популярные Web-сервисы: практика использования, Айверсон У., 2005
  27. PHP. Сборник рецептов, Скляр Д., Трахтенберг А., 2005
  28. PHP 4. Разработка Web-приложений (+ CD-ROM), Ратшиллер Т., Геркен Т., 2001
  29. Профессиональное PHP программирование, 2-е издание, 2003
  30. PHP. Справочник, Хадсон П., 2006
  31. Разработка программного обеспечения, Константайн Л., Локвуд Л., 2004
  32. Управление проектом по созданию интернет-сайта, Курдюмов И., ред., 2001
  33. Разработка приложений для электронной коммерции (+ CD - ROM), Джерк Н., 2001
  34. Dynamic HTML, Айзекс С., 1998
  35. Dynamic HTML: справочник, Хоумер А., Улмен К., 2000
  36. HTML и XHTML. Подробное руководство, Муссиано Ч., Кеннеди Б., 2002
  37. JavaScript и DHTML. Сборник рецептов. Для профессионалов, Гудман Д., 2004
  38. Анализ информационно-поисковых систем, Мидоу Ч. Т., 1970
  39. Искусство программирования на C. Фундаментальные алгоритмы, структуры данных и примеры приложений, Хэзфилд Р., Кирби Л., 2001

© 1913—2013 КнигоПровод.Ruhttp://knigoprovod.ru