In [1]:
import re
import pandas as pd
import requests
import openpyxl
from time import sleep
from random import uniform
from tqdm import tqdm
from bs4 import BeautifulSoup

In [2]:
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

In [13]:
def get_page(url):
    try:
        response = requests.get(url, headers=headers, timeout=35)
        response.raise_for_status()
        return BeautifulSoup(response.text, 'lxml')
    except requests.exceptions.RequestException as e:
        print(f"Error fetching {url}: {e}")
        return None

In [4]:
def scrape_criminals(url):
    soup = get_page(url)
    hrefs = soup.find_all("a", class_="branches-list__item iconf-share2")
    links = [a['href'] for a in hrefs if a.has_attr('href')]
    soup_links = []
    for link in links:
        soup_links.append(get_page(link))
        sleep(uniform(1, 2))
    links_next = []
    for i in tqdm(range(len(soup_links))):
        menu_links = []
        menu_links = soup_links[i].find_all("a", class_="b-menu-link")
        for link in menu_links:
            if link.text == 'Внимание, розыск!' and link.has_attr('href'):
                links_next.append(f"{links[i]}{link['href']}")
        sleep(uniform(1, 2))
    soup_links_next = []
    for link in links_next:
        soup_links_next.append(get_page(link))
        sleep(uniform(1, 2))
    links_next_next = []
    for i in tqdm(range(len(soup_links_next))):
        main_links = []
        main_links = soup_links_next[i].find_all("li")
        for link in main_links:
            a_tag = link.find('a')
            if link.text == 'Подозреваемые в совершении преступлений' and a_tag.has_attr('href'):
                links_next_next.append(f"{links[i]}{a_tag['href']}")
        sleep(uniform(1, 2))
    links_next_next_full = []
    for i in tqdm(range(len(links_next_next))):
        j = 1
        while True:
            link = f"{links_next_next[i]}/{j}/"
            try:
                response = requests.get(link, headers=headers)
                if response.status_code == 200:
                    j += 1
                    links_next_next_full.append(link)
                    print(link)
                else:
                    break
            except requests.exceptions.RequestException as e:
                print(f"Error fetching {link}: {e}")
                break
        sleep(uniform(1, 2))
    soup_links_next_next_full = []
    for link in links_next_next_full:
        soup_links_next_next_full.append(get_page(link))
        sleep(uniform(1, 2))
    criminals = []
    for i in range(len(soup_links_next_next_full)):
        criminals.append(soup_links_next_next_full[i].find_all("div", class_="bl-item clearfix"))
    return criminals, links_next_next_full

In [17]:
def scrape_criminal_data(criminals, links_next_next_full):
    pattern = r"^(?:[^/]*\/){3}(.*)"
    pattern_full_text = r'^\n$'
    pattern_base_url = r'^(https?://[^/]+)'
    pattern_drop_end = r'^(.*)\/.*?\/$'
    df = pd.DataFrame(columns=['Title', 'Text', 'Image'])
    for i in tqdm(range(len(criminals))):
        for j in range(len(criminals[i])):
            title = ""
            image_url = ""
            full_text = ""
            title_div = criminals[i][j].find("div", class_="bl-item-title")
            if title_div:
                a_tag = title_div.find("a")
                if a_tag:
                    href_criminal = a_tag
                    if href_criminal:
                        match = re.search(pattern, href_criminal['href'])
                        if match:
                            extracted_part = match.group(1)
                            links_next_next_full_drop_end_group = re.search(pattern_drop_end, links_next_next_full[i])
                            links_next_next_full_drop_end = links_next_next_full_drop_end_group.group(1)
                            full_path_to_criminal = f'{links_next_next_full_drop_end}/{extracted_part}'
                            criminal_html = get_page(full_path_to_criminal)
                            if criminal_html:
                                criminal_info_blocks = criminal_html.find("section", class_="b-container-center")
                                title_element = criminal_info_blocks.find("h1", class_="b-topic t-h1 m_b4")
                                if title_element:
                                    title = title_element.text
                                else:
                                    criminal_info_blocks = criminal_html.find("div", id="news_position")
                                    title_element = criminal_info_blocks.find("div", class_="header")
                                    if title_element:
                                        title_find = title_element.find("h1")
                                        if title_find:
                                            title = title_find.text
                                article = criminal_info_blocks.find("article", class_="c-detail m_b4")
                                if article:
                                    match = re.match(pattern_base_url, links_next_next_full[i])
                                    if match:
                                        base_url = match.group(1)
                                    img_tag = article.find("img")
                                    if img_tag:
                                        image_url = f'{base_url}{img_tag.get("src")}'
                                    paragraphs = article.find_all(['p', 'div', 'span', 'br'])
                                    full_text = "\n".join([p.text.strip() for p in paragraphs])
                                    if re.match(pattern_full_text, full_text):
                                        full_text = article.text
                                else:
                                    div = criminal_info_blocks.find("div", class_="c-detail text")
                                    if div:
                                        match = re.match(pattern_base_url, links_next_next_full[i])
                                        if match:
                                            base_url = match.group(1)
                                        img_tag = div.find("img")
                                        if img_tag:
                                            image_url = f'{base_url}{img_tag.get("src")}'
                                        paragraphs = div.find_all(['p', 'div', 'span', 'br'])
                                        full_text = "\n".join([p.text.strip() for p in paragraphs])
                                df.loc[len(df)] = title, full_text, image_url
            sleep(uniform(1, 2))
    return df

In [6]:
url = "https://sledcom.ru/sk_russia/structure/mapregions/"

In [7]:
criminals, links_next_next_full = scrape_criminals(url)

100%|██████████| 89/89 [02:13<00:00,  1.50s/it]
100%|██████████| 89/89 [02:18<00:00,  1.56s/it]
  0%|          | 0/76 [00:00<?, ?it/s]

http://belgorod.sledcom.ru/attention/suspected_persons/1/


  1%|▏         | 1/76 [00:03<04:44,  3.79s/it]

http://vladimir.sledcom.ru/attention/suspected_persons/1/


  3%|▎         | 2/76 [00:06<04:05,  3.32s/it]

http://voronezh.sledcom.ru/attention/suspected_persons/1/


  4%|▍         | 3/76 [00:10<04:19,  3.56s/it]

http://ivanovo.sledcom.ru/attention/suspected_persons/1/
http://ivanovo.sledcom.ru/attention/suspected_persons/2/
http://ivanovo.sledcom.ru/attention/suspected_persons/3/


  5%|▌         | 4/76 [00:15<04:44,  3.95s/it]

http://kaluga.sledcom.ru/attention/suspected_persons/1/


  7%|▋         | 5/76 [00:18<04:31,  3.83s/it]

http://kursk.sledcom.ru/attention/suspected_persons/1/
http://kursk.sledcom.ru/attention/suspected_persons/2/
http://kursk.sledcom.ru/attention/suspected_persons/3/


  8%|▊         | 6/76 [00:23<04:42,  4.04s/it]

http://lipetsk.sledcom.ru/attention/suspected_persons/1/


  9%|▉         | 7/76 [00:26<04:25,  3.85s/it]

http://moscow.sledcom.ru/attention/Podozrevaemie_v_sovershenii_prestuplenij/1/


 11%|█         | 8/76 [00:29<03:59,  3.52s/it]

http://mosobl.sledcom.ru/attention/Podozrevaemie_v_sovershenii_prestuplenij/1/
http://mosobl.sledcom.ru/attention/Podozrevaemie_v_sovershenii_prestuplenij/2/


 12%|█▏        | 9/76 [00:33<04:14,  3.80s/it]

http://orel.sledcom.ru/attention/suspected_persons/1/


 13%|█▎        | 10/76 [00:37<04:03,  3.68s/it]

http://ryazan.sledcom.ru/attention/suspected_persons/1/
http://ryazan.sledcom.ru/attention/suspected_persons/2/


 14%|█▍        | 11/76 [00:40<03:54,  3.60s/it]

http://smolensk.sledcom.ru/attention/suspected_persons/1/
http://smolensk.sledcom.ru/attention/suspected_persons/2/
http://smolensk.sledcom.ru/attention/suspected_persons/3/


 16%|█▌        | 12/76 [00:44<03:53,  3.65s/it]

http://tambov.sledcom.ru/attention/suspected_persons/1/
http://tambov.sledcom.ru/attention/suspected_persons/2/
http://tambov.sledcom.ru/attention/suspected_persons/3/


 17%|█▋        | 13/76 [00:49<04:13,  4.03s/it]

http://tver.sledcom.ru/attention/suspected_persons/1/


 18%|█▊        | 14/76 [00:53<04:05,  3.95s/it]

http://yaroslavl.sledcom.ru/attention/suspected_persons/1/
http://yaroslavl.sledcom.ru/attention/suspected_persons/2/
http://yaroslavl.sledcom.ru/attention/suspected_persons/3/
http://yaroslavl.sledcom.ru/attention/suspected_persons/4/


 20%|█▉        | 15/76 [00:59<04:46,  4.70s/it]

http://zmsut.sledcom.ru/attention/suspected_persons/1/
http://zmsut.sledcom.ru/attention/suspected_persons/2/


 21%|██        | 16/76 [01:03<04:26,  4.44s/it]

http://arh.sledcom.ru/attention/suspected_persons/1/
http://arh.sledcom.ru/attention/suspected_persons/2/
http://arh.sledcom.ru/attention/suspected_persons/3/
http://arh.sledcom.ru/attention/suspected_persons/4/
http://arh.sledcom.ru/attention/suspected_persons/5/
http://arh.sledcom.ru/attention/suspected_persons/6/


 22%|██▏       | 17/76 [01:10<05:00,  5.10s/it]

http://vologda.sledcom.ru/attention/suspected_persons/1/
http://vologda.sledcom.ru/attention/suspected_persons/2/
http://vologda.sledcom.ru/attention/suspected_persons/3/


 24%|██▎       | 18/76 [01:15<04:56,  5.11s/it]

http://kld.sledcom.ru/attention/suspected_persons/1/
http://kld.sledcom.ru/attention/suspected_persons/2/


 25%|██▌       | 19/76 [01:19<04:29,  4.73s/it]

http://lenobl.sledcom.ru/attention/suspected_persons/1/
http://lenobl.sledcom.ru/attention/suspected_persons/2/
http://lenobl.sledcom.ru/attention/suspected_persons/3/
http://lenobl.sledcom.ru/attention/suspected_persons/4/
http://lenobl.sledcom.ru/attention/suspected_persons/5/
http://lenobl.sledcom.ru/attention/suspected_persons/6/
http://lenobl.sledcom.ru/attention/suspected_persons/7/
http://lenobl.sledcom.ru/attention/suspected_persons/8/
http://lenobl.sledcom.ru/attention/suspected_persons/9/
http://lenobl.sledcom.ru/attention/suspected_persons/10/
http://lenobl.sledcom.ru/attention/suspected_persons/11/
http://lenobl.sledcom.ru/attention/suspected_persons/12/
http://lenobl.sledcom.ru/attention/suspected_persons/13/
http://lenobl.sledcom.ru/attention/suspected_persons/14/
http://lenobl.sledcom.ru/attention/suspected_persons/15/
http://lenobl.sledcom.ru/attention/suspected_persons/16/
http://lenobl.sledcom.ru/attention/suspected_persons/17/


 26%|██▋       | 20/76 [01:35<07:41,  8.24s/it]

http://murmansk.sledcom.ru/attention/suspected_persons/1/
http://murmansk.sledcom.ru/attention/suspected_persons/2/
http://murmansk.sledcom.ru/attention/suspected_persons/3/


 28%|██▊       | 21/76 [01:39<06:26,  7.03s/it]

http://vnovgorod.sledcom.ru/attention/suspected_persons/1/
http://vnovgorod.sledcom.ru/attention/suspected_persons/2/
http://vnovgorod.sledcom.ru/attention/suspected_persons/3/
http://vnovgorod.sledcom.ru/attention/suspected_persons/4/


 29%|██▉       | 22/76 [01:45<05:59,  6.66s/it]

http://pskov.sledcom.ru/attention/suspected_persons/1/
http://pskov.sledcom.ru/attention/suspected_persons/2/
http://pskov.sledcom.ru/attention/suspected_persons/3/


 30%|███       | 23/76 [01:50<05:19,  6.04s/it]

http://karelia.sledcom.ru/attention/suspected_persons/1/
http://karelia.sledcom.ru/attention/suspected_persons/2/
http://karelia.sledcom.ru/attention/suspected_persons/3/


 32%|███▏      | 24/76 [01:54<04:43,  5.45s/it]

http://komi.sledcom.ru/attention/suspected_persons/1/
http://komi.sledcom.ru/attention/suspected_persons/2/


 33%|███▎      | 25/76 [01:58<04:23,  5.16s/it]

http://spb.sledcom.ru/folder/918993/1/
http://spb.sledcom.ru/folder/918993/2/
http://spb.sledcom.ru/folder/918993/3/
http://spb.sledcom.ru/folder/918993/4/
http://spb.sledcom.ru/folder/918993/5/
http://spb.sledcom.ru/folder/918993/6/
http://spb.sledcom.ru/folder/918993/7/
http://spb.sledcom.ru/folder/918993/8/
http://spb.sledcom.ru/folder/918993/9/
http://spb.sledcom.ru/folder/918993/10/
http://spb.sledcom.ru/folder/918993/11/


 34%|███▍      | 26/76 [02:10<05:53,  7.08s/it]

http://astr.sledcom.ru/attention/suspected_persons/1/


 36%|███▌      | 27/76 [02:13<04:47,  5.87s/it]

http://volgograd.sledcom.ru/attention/suspected_persons/1/
http://volgograd.sledcom.ru/attention/suspected_persons/2/


 37%|███▋      | 28/76 [02:16<04:07,  5.16s/it]

http://kuban.sledcom.ru/attention/suspected_persons/1/
http://kuban.sledcom.ru/attention/suspected_persons/2/


 38%|███▊      | 29/76 [02:19<03:34,  4.56s/it]

http://adygheya.sledcom.ru/attention/suspected_persons/1/
http://adygheya.sledcom.ru/attention/suspected_persons/2/
http://adygheya.sledcom.ru/attention/suspected_persons/3/
http://adygheya.sledcom.ru/attention/suspected_persons/4/
http://adygheya.sledcom.ru/attention/suspected_persons/5/
http://adygheya.sledcom.ru/attention/suspected_persons/6/
http://adygheya.sledcom.ru/attention/suspected_persons/7/
http://adygheya.sledcom.ru/attention/suspected_persons/8/
http://adygheya.sledcom.ru/attention/suspected_persons/9/
http://adygheya.sledcom.ru/attention/suspected_persons/10/
http://adygheya.sledcom.ru/attention/suspected_persons/11/
http://adygheya.sledcom.ru/attention/suspected_persons/12/


 39%|███▉      | 30/76 [02:30<04:52,  6.35s/it]

http://kalmykia.sledcom.ru/folder/870600/1/
http://kalmykia.sledcom.ru/folder/870600/2/
http://kalmykia.sledcom.ru/folder/870600/3/


 41%|████      | 31/76 [02:34<04:20,  5.79s/it]

http://crim.sledcom.ru/attention/suspected_persons/1/
http://crim.sledcom.ru/attention/suspected_persons/2/
http://crim.sledcom.ru/attention/suspected_persons/3/


 42%|████▏     | 32/76 [02:39<04:03,  5.54s/it]

http://kchr.sledcom.ru/attention/suspected_persons/1/


 43%|████▎     | 33/76 [02:42<03:22,  4.72s/it]

http://dagestan.sledcom.ru/attention/suspected_persons/1/
http://dagestan.sledcom.ru/attention/suspected_persons/2/


 45%|████▍     | 34/76 [02:46<03:10,  4.55s/it]

http://ingushetia.sledcom.ru/attention/suspected_persons/1/
http://ingushetia.sledcom.ru/attention/suspected_persons/2/


 46%|████▌     | 35/76 [02:50<03:00,  4.39s/it]

http://chr.sledcom.ru/attention/suspected_persons/1/


 47%|████▋     | 36/76 [02:53<02:37,  3.94s/it]

http://kirov.sledcom.ru/attention/suspected_persons/1/
http://kirov.sledcom.ru/attention/suspected_persons/2/


 49%|████▊     | 37/76 [02:57<02:29,  3.83s/it]

http://nnovgorod.sledcom.ru/attention/suspected_persons/1/
http://nnovgorod.sledcom.ru/attention/suspected_persons/2/


 50%|█████     | 38/76 [03:01<02:33,  4.03s/it]

http://oren.sledcom.ru/attention/suspected_persons/1/


 51%|█████▏    | 39/76 [03:05<02:20,  3.79s/it]

http://penza.sledcom.ru/attention/suspected_persons/1/
http://penza.sledcom.ru/attention/suspected_persons/2/
http://penza.sledcom.ru/attention/suspected_persons/3/


 53%|█████▎    | 40/76 [03:10<02:29,  4.17s/it]

http://perm.sledcom.ru/attention/suspected_persons/1/
http://perm.sledcom.ru/attention/suspected_persons/2/


 54%|█████▍    | 41/76 [03:13<02:17,  3.93s/it]

http://surb.sledcom.ru/attention/Podozrevaemye-v-sovershenii-prestuplenij/1/


 55%|█████▌    | 42/76 [03:16<02:03,  3.63s/it]

http://mari.sledcom.ru/attention/suspected_persons/1/
http://mari.sledcom.ru/attention/suspected_persons/2/


 57%|█████▋    | 43/76 [03:19<01:58,  3.59s/it]

http://mordovia.sledcom.ru/attention/suspected_persons/1/
http://mordovia.sledcom.ru/attention/suspected_persons/2/
http://mordovia.sledcom.ru/attention/suspected_persons/3/


 58%|█████▊    | 44/76 [03:23<01:58,  3.71s/it]

http://tatarstan.sledcom.ru/attention/suspected_persons/1/


 59%|█████▉    | 45/76 [03:26<01:42,  3.31s/it]

http://samara.sledcom.ru/attention/suspected_persons/1/


 61%|██████    | 46/76 [03:29<01:42,  3.43s/it]

http://saratov.sledcom.ru/attention/suspected_persons/1/


 62%|██████▏   | 47/76 [03:33<01:42,  3.55s/it]

http://udm.sledcom.ru/attention/suspected_persons/1/
http://udm.sledcom.ru/attention/suspected_persons/2/


 63%|██████▎   | 48/76 [03:37<01:42,  3.65s/it]

http://ulyanovsk.sledcom.ru/attention/suspected_persons/1/


 64%|██████▍   | 49/76 [03:40<01:32,  3.43s/it]

http://chuvashia.sledcom.ru/attention/suspected_persons/1/


 66%|██████▌   | 50/76 [03:43<01:23,  3.23s/it]

http://psut.sledcom.ru/attention/suspected_persons/1/


 67%|██████▋   | 51/76 [03:46<01:19,  3.19s/it]

http://kurgan.sledcom.ru/attention/suspected_persons/1/
http://kurgan.sledcom.ru/attention/suspected_persons/2/
http://kurgan.sledcom.ru/attention/suspected_persons/3/
http://kurgan.sledcom.ru/attention/suspected_persons/4/
http://kurgan.sledcom.ru/attention/suspected_persons/5/
http://kurgan.sledcom.ru/attention/suspected_persons/6/


 68%|██████▊   | 52/76 [03:52<01:39,  4.13s/it]

http://sverdlovsk.sledcom.ru/attention/suspected_persons/1/
http://sverdlovsk.sledcom.ru/attention/suspected_persons/2/
http://sverdlovsk.sledcom.ru/attention/suspected_persons/3/
http://sverdlovsk.sledcom.ru/attention/suspected_persons/4/


 70%|██████▉   | 53/76 [03:58<01:48,  4.70s/it]

http://tyumen.sledcom.ru/attention/suspected_persons/1/
http://tyumen.sledcom.ru/attention/suspected_persons/2/


 71%|███████   | 54/76 [04:02<01:34,  4.30s/it]

http://chel.sledcom.ru/attention/suspected_persons/1/


 72%|███████▏  | 55/76 [04:04<01:20,  3.83s/it]

http://yanao.sledcom.ru/attention/suspected_persons/1/


 74%|███████▎  | 56/76 [04:08<01:15,  3.75s/it]

http://altai-krai.sledcom.ru/attention/suspected_persons/1/


 75%|███████▌  | 57/76 [04:12<01:11,  3.77s/it]

http://irk.sledcom.ru/attention/suspected_persons/1/


 76%|███████▋  | 58/76 [04:15<01:03,  3.52s/it]

http://kuzbass.sledcom.ru/attention/suspected_persons/1/


 78%|███████▊  | 59/76 [04:18<00:58,  3.44s/it]

http://nsk.sledcom.ru/attention/suspected_persons/1/
http://nsk.sledcom.ru/attention/suspected_persons/2/
http://nsk.sledcom.ru/attention/suspected_persons/3/


 79%|███████▉  | 60/76 [04:23<01:02,  3.92s/it]

http://omsk.sledcom.ru/attention/suspected_persons/1/
http://omsk.sledcom.ru/attention/suspected_persons/2/


 80%|████████  | 61/76 [04:27<01:00,  4.05s/it]

http://altai.sledcom.ru/attention/suspected_persons/1/


 82%|████████▏ | 62/76 [04:31<00:54,  3.92s/it]

http://tuva.sledcom.ru/attention/suspected_persons/1/


 83%|████████▎ | 63/76 [04:34<00:49,  3.80s/it]

http://zapsib-sut.sledcom.ru/attention/suspected_persons/1/
http://zapsib-sut.sledcom.ru/attention/suspected_persons/2/
http://zapsib-sut.sledcom.ru/attention/suspected_persons/3/


 84%|████████▍ | 64/76 [04:39<00:49,  4.11s/it]

http://amur.sledcom.ru/attention/suspected_persons/1/
http://amur.sledcom.ru/attention/suspected_persons/2/
http://amur.sledcom.ru/attention/suspected_persons/3/
http://amur.sledcom.ru/attention/suspected_persons/4/


 86%|████████▌ | 65/76 [04:46<00:53,  4.82s/it]

http://khabkray.sledcom.ru/attention/suspected_persons/1/
http://khabkray.sledcom.ru/attention/suspected_persons/2/
http://khabkray.sledcom.ru/attention/suspected_persons/3/


 87%|████████▋ | 66/76 [04:51<00:48,  4.83s/it]

http://zabaykalye.sledcom.ru/attention/Podozrevaemye-v-sovershenii-prestuplenij/1/


 88%|████████▊ | 67/76 [04:53<00:37,  4.18s/it]

http://kamchatka.sledcom.ru/attention/suspected_persons/1/


 89%|████████▉ | 68/76 [04:56<00:29,  3.67s/it]

http://magadan.sledcom.ru/attention/suspected_persons/1/


 91%|█████████ | 69/76 [04:59<00:24,  3.50s/it]

http://primorsky.sledcom.ru/attention/suspected_persons/1/
http://primorsky.sledcom.ru/attention/suspected_persons/2/


 92%|█████████▏| 70/76 [05:03<00:21,  3.65s/it]

http://buryatia.sledcom.ru/attention/suspected_persons/1/
http://buryatia.sledcom.ru/attention/suspected_persons/2/
http://buryatia.sledcom.ru/attention/suspected_persons/3/


 93%|█████████▎| 71/76 [05:08<00:20,  4.10s/it]

http://ykt.sledcom.ru/attention/suspected_persons/1/
http://ykt.sledcom.ru/attention/suspected_persons/2/


 95%|█████████▍| 72/76 [05:11<00:15,  3.87s/it]

http://sakh.sledcom.ru/attention/suspected_persons/1/


 96%|█████████▌| 73/76 [05:14<00:10,  3.51s/it]

http://chukotka.sledcom.ru/attention/suspected_persons/1/


 97%|█████████▋| 74/76 [05:17<00:06,  3.29s/it]

http://kherson.sledcom.ru/attention/suspected_persons/1/


 99%|█████████▊| 75/76 [05:20<00:03,  3.30s/it]

http://zaporozhye.sledcom.ru/attention/suspected_persons/1/


100%|██████████| 76/76 [05:23<00:00,  4.26s/it]


In [18]:
df = scrape_criminal_data(criminals, links_next_next_full)

100%|██████████| 185/185 [1:00:45<00:00, 19.71s/it]


In [19]:
df

Unnamed: 0,Title,Text,Image
0,Внимание! Розыск! Устанавливается подозреваемы...,Приметы напавшего по состоянию на 2015 год: на...,http://vladimir.sledcom.ru/upload/site16/docum...
1,"Пономарев Игорь Сергеевич, 27.07.1975 г.р.","\nуголовное дело № 1628, возбуждено 28.07.2005...",
2,"Петросян Арарат Матевосович, 2.04.1962 г.р.","\n1. уголовное дело № 1636, возбуждено 14.08.2...",http://vladimir.sledcom.ru/upload/site16/6yzCh...
3,Мусаев Асиф Джалал оглы,"\n1. уголовное дело № 792, возбуждено 1.05.20...",http://vladimir.sledcom.ru/upload/site16/OAoVX...
4,Тухтаров Баходур Хангеевич,"\nуголовное дело № 2479, возбуждено 10.08.2005...",
...,...,...,...
1491,ВНИМАНИЕ РОЗЫСК,\n\n\nВтором отделом по расследованию особо ва...,http://zaporozhye.sledcom.ru/upload/site105/do...
1492,ВНИМАНИЕ РОЗЫСК,\n\n\nПервым отделом по расследованию особо ва...,http://zaporozhye.sledcom.ru/upload/site105/do...
1493,ВНИМАНИЕ РОЗЫСК,\n\n\nУроженка г. Бердянск Запорожской области...,http://zaporozhye.sledcom.ru/upload/site105/do...
1494,ВНИМАНИЕ РОЗЫСК,\n\n\nПервым отделом по расследованию особо ва...,http://zaporozhye.sledcom.ru/upload/site105/do...


In [20]:
df.to_excel('sledcom.xlsx')

In [21]:
df.to_csv('sledcom.csv')