Парсинг
в современном СМИ

Заказчик: SETTERS media
Статус: В работе
Направление: Разработка
Студенты: Сергей Даревский
Набор на проект закрыт

Описание

Современный интернет переполнен информацией, но находить действительно важные и достоверные данные становится всё сложнее. Люди всё реже читают сайты и статьи целиком, а вместо этого ищут конкретные ответы на свои вопросы.

Наш проект направлен на создание бота, который сможет выдавать пользователю структурированную информацию по запросу. Первый этап работы – использование уже существующей базы данных: её нужно правильно обрабатывать, анализировать и представлять в удобной форме. Затем мы добавим автоматизированный краулинг, чтобы бот мог находить новые данные в интернете.

Почему это важный проект?

Медиа все сложнее конкурировать за внимание читателя с соцсетями и поисковыми системами. С помощью этого инструмента можно закрыть потребность читателя, выдывая ровно то, что ему в данный момент нужно.

Этот инструмент создаст для SETTERS Media новый канал взаимодействия с читателями.
Научитесь хранить, обрабатывать и быстро находить нужную информацию.

Обход ограничений

Краулинг и парсинг

Работа с базами данных

Чему ты научишься

Освоите методы автоматического сбора данных из открытых источников.
Поймёте, как работать с динамическими сайтами и сложными структурами данных.

Фильтрация и анализ информации

Разработка Telegram-ботов

Научитесь выделять главное и представлять данные в удобном формате.
Изучите, как интегрировать бота с базами данных и алгоритмами поиска.

Татаренков Даниил

  • Разработал 4 сервиса для защиты средств клиентов от злоумышленников
Разработчик отдела краулинга в сфере противодействия мошенничеству в T-Bank

Ментор проекта

Ожидаемый результат

Выдаёт пользователю информацию из существующей базы данных.
Автоматически обновляет данные, находя новую информацию в интернете.
Фильтрует и анализирует контент, отбирая только актуальные и значимые сведения.
В результате работы над проектом будет создан Telegram-бот, который: