Это зеркальный репозиторий, синхронизируется ежедневно с исходного репозитория.
Внести вклад в разработку кода
Синхронизировать код
README.md
1. Webmagic-learn
1. Введение
- Использование Webmagic и Springboot для сбора данных с CSDN блога, сбора видео с Айки и 360影视. С использованием таймера данные из паука очищаются каждые 24 часа и собираются заново, чтобы данные были максимально актуальными.
2. Технологии на бэкенде
SpringBoot, MySQL, SpringBoot Data JPA, Webmagic, Redis.
3. Результаты работы

-
Страница со списком фильмов
Данные о фильмах (название, URL и т. д.) собираются с официального сайта Айки с помощью Webmagic и сохраняются в базе данных MySQL. Список фильмов отображается на странице, и при нажатии на кнопку «Анализ» можно воспроизвести видео.
-
Данные списка фильмов в базе данных
Данные собираются с помощью Webmagic с официального сайта Айки и сохраняются в MySQL.
-
Страница списка блогов CSDN
Данные собираются с сайта CSDN с помощью Webmagic и сохраняются в базе данных MySQL. На странице со списком блогов можно нажать на заголовок блога, чтобы просмотреть его содержимое.

-
Данные пауков в списке блогов в базе данных CSDN
Данные собираются с сайта CSDN с помощью Webmagic и сохраняются в MySQL.

- Сбор данных блогов с CSDN, результат показан на рисунке ниже.

4. Локальный запуск
- Установка программного обеспечения. Необходимо установить Java, Maven, MySQL и другие программы.
- Загрузка кода проекта. Выполните команду git clone git@gitee.com:fengsam618/webmagic-learn.git, чтобы импортировать проект в Idea.
- Запустите файл spider_film.sql в папке sql с помощью Navicat. Успешное выполнение создаст две таблицы.
- Измените файл application-dev.properties в каталоге resource. Особое внимание уделите изменению имени базы данных, имени пользователя и пароля для подключения.
- Откройте Idea, запустите её успешно, а затем перейдите к http://localhost/.
- Для развёртывания обратитесь к скриптам в каталоге bin.
5. Что предстоит сделать
- Добавить поддержку различных видов поиска в список фильмов (по названию фильма, времени).
- Решить проблему с неправильными URL-адресами изображений фильмов.
- Реализовать инкрементную вставку данных и автоматическую вставку по расписанию.
- Обеспечить возможность переключения между линиями воспроизведения видео и анализ URL-адресов VIP-видео.
6. Примечания
- Адрес проекта на Code Cloud: https://gitee.com/fengsam618/webmagic-learn.
- Адрес проекта на GitHub: https://github.com/fengsam6/webmagic-learn.
- Если вам интересно, можете попробовать.
- Прекратите использование, если есть нарушение авторских прав на видеоанализ.
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )