Skip to content

cdies/news_aggregator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 

Repository files navigation

https://habr.com/ru/post/689520/

агрегатор новостей

Для работы необходимо:

  1. Добавить свои значения переменных в файл config.py:

1.1 Параметры из my.telegram.org

  • api_id = <Твой api_id int>
  • api_hash = <Твой api_hash str>

1.2 Бот из @BotFather

  • bot_token = <Токен твоего бота str>

1.3 id канала, куда будут сливаться все новости

  • gazp_chat_id = <Id твоего канала c минусом в начале int>
  1. Запустить телеграм парсер telegram_parser.py, чтобы пройти аутентификацию в telethon и получить свои файлы сессии bot.session и gazp.session

Агрегатор по умолчанию парсит новости из:

телеграм каналы

RSS каналы

новостные сайты

Настройка и запуск

Фильтр по умолчанию настроен на газпром, газ и всё с этим связанное (хотя иногда проскакивают и другие новости). Добавить/убавить свои каналы или поменять фильтры для новостей можно в файле main.py

Каждый парсер написан таким образом, чтобы его можно было запустить отдельно от остальных. Это значительно упрощает процесс добавления новых источников, их лучше проверять отдельно, чтобы убедиться в работоспособности. Например, feedparser может не прочитать RSS канал и тогда его придется парсить вручную.

  • telegram_parser.py - парсер телеграм каналов
  • rss_parser.py - парсер RSS каналов
  • bcs_parser.py - кастомный парсер сайта www.bcs-express.ru
  • main.py - запускает все парсеры сразу, либо можно запустить в докере через docker-compose.yml



About

Полный агрегатор новостей

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published