# HTML 의 정의와 기본 실습
- \<!DOCTYPE html>: 이 문서가 HTML5를 사용한다고 선언하는 선언부입니다.
- \<html>: HTML 문서의 시작을 나타내는 태그로, 모든 HTML 요소들을 감싸는 최상위 요소입니다.
- \<head>: 문서의 메타 정보를 정의하는 부분으로, 웹 브라우저에 표시되지 않습니다. 문서 제목과 같은 정보가 여기에 위치합니다.
- \<title>: 웹 브라우저의 탭에 표시될 문서의 제목을 정의하는 태그입니다.
- \<body>: 실제 웹 페이지의 내용이 위치하는 부분으로, 사용자에게 보여집니다.
- \<h1>: 큰 제목을 정의하는 태그입니다. (h1부터 h6까지 사용 가능)
- \<p>: 단락을 정의하는 태그입니다.
- \<a>: 링크를 생성하는 태그로, href 속성을 사용하여 링크의 대상 URL을 지정합니다.
- \<img>: 이미지를 삽입하는 태그로, src 속성을 사용하여 이미지 파일의 경로를 지정하고, alt 속성은 이미지에 대한 설명을 제공합니다. 이미지 파일이 없을 경우에도 이 속성을 사용해야 합니다.

### 태그와 속성 개념 이해하기 

##  HTML 파일 직접 만들어보기 
- HTML 문법을 작성한다. 
- .html 로 저장한다. 
- 실행한다(브라우져로 연다). 
- [명언사이트](http://quotes.toscrape.com/)를 통해 실습

## 가장 먼저 할 일 
- beautifulsoup 설치하기 
- requests로 기본명령어 수행하기 
- a 태그 안 주소 추출

In [21]:
import requests 
from bs4 import BeautifulSoup
headers = {"User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36'}
url = 'http://quotes.toscrape.com/' 
soup = BeautifulSoup(requests.get(url, verify=False, headers = headers).text, 'html.parser')

soup.find_all('a')
#for i in soup.find_all('div',{"class":"quote"}):
 #   print(i.find('a').get('href')) # a 찾기 


[<a href="/" style="text-decoration: none">Quotes to Scrape</a>,
 <a href="/login">Login</a>,
 <a href="/author/Albert-Einstein">(about)</a>,
 <a class="tag" href="/tag/change/page/1/">change</a>,
 <a class="tag" href="/tag/deep-thoughts/page/1/">deep-thoughts</a>,
 <a class="tag" href="/tag/thinking/page/1/">thinking</a>,
 <a class="tag" href="/tag/world/page/1/">world</a>,
 <a href="/author/J-K-Rowling">(about)</a>,
 <a class="tag" href="/tag/abilities/page/1/">abilities</a>,
 <a class="tag" href="/tag/choices/page/1/">choices</a>,
 <a href="/author/Albert-Einstein">(about)</a>,
 <a class="tag" href="/tag/inspirational/page/1/">inspirational</a>,
 <a class="tag" href="/tag/life/page/1/">life</a>,
 <a class="tag" href="/tag/live/page/1/">live</a>,
 <a class="tag" href="/tag/miracle/page/1/">miracle</a>,
 <a class="tag" href="/tag/miracles/page/1/">miracles</a>,
 <a href="/author/Jane-Austen">(about)</a>,
 <a class="tag" href="/tag/aliteracy/page/1/">aliteracy</a>,
 <a class="tag" href

# URL은 어떻게 생겼나 확인
- 브라우저에서 url 정보 확인하기 
- 어떤 부분을 바꿀 수 있는지 확인

In [9]:
#명언만 추출하기 
for i in soup.find_all('div',{"class":"quote"}):
    try:
        print(i.find('span',{'class':'text'}).text)
    except UnicodeEncodeError as e:
        print(f"Error encoding character: {e}")
        # 유니코드 인코드 에러는 챗GPT로 해결 

“The world as we have created it is a process of our thinking. It cannot be changed without changing our thinking.”
“It is our choices, Harry, that show what we truly are, far more than our abilities.”
“There are only two ways to live your life. One is as though nothing is a miracle. The other is as though everything is a miracle.”
“The person, be it gentleman or lady, who has not pleasure in a good novel, must be intolerably stupid.”
“Imperfection is beauty, madness is genius and it's better to be absolutely ridiculous than absolutely boring.”
“Try not to become a man of success. Rather become a man of value.”
“It is better to be hated for what you are than to be loved for what you are not.”
“I have not failed. I've just found 10,000 ways that won't work.”
“A woman is like a tea bag; you never know how strong it is until it's in hot water.”
“A day without sunshine is like, you know, night.”


# 다음 사전에서 life의 뜻과 예문 찾기 
- 사이트 살펴보기
- url 조사하기 

In [16]:
url = 'https://dic.daum.net/search.do?q=life&dic=eng' 
soup = BeautifulSoup(requests.get(url, verify=False, headers = headers).text, 'html.parser')

# 뜻 찾기 
for i in soup.find_all('span',{"class":"txt_search"}):
    print(i.text)
     
#예문 찾기 
for i in soup.find_all('ul',{"class":"list_example sound_example"}):
    print(i.text)



삶
생활
생명
인생
수명
생명
(단수형) 생존 기간
인생
일생의
생명의
라이프
라이프 해크(특히 개인의 일상생활에서 문제 해결, 과제 단순화, 좌절감 축소 등을 위해 하는 모든 행동 또는 조처)
(한정적) 실제인
현실 그대로의
실제로 있었던
(사회적) 지위
계급
직업
생활 양식
사는 보람
life
the life
the soul
life
one's life
life
existence
livelihood
living
subsistence
life
wear
man's life span
durability
the span of life
life
vitality
vigor
animation
spirit




This exhibition will give you an opportunity to explore the life of Gauguin.
(Junior Edu times) 

이번 전시회는 당신에게 고갱의 삶을 탐험할 수 있는 기회를 제공할 것이다.



소리듣기





Scientists want to know if life ever lived on Mars.
(Kids Edu times) 

과학자들은 화성에 생물이 존재한 적이 있었는지를 알고 싶어한다.



소리듣기





With their recent success, many observers are hoping that the talented sibling duo will breathe new life into the K-Pop industry.
(Junior Edu times) 

최근 그들의 성공을 통해 많은 대중들은 재능 있는 남매 2인조가 한국 가요계의 새로운 바람을 불어 넣길 희망 하고 있다



소리듣기





While healing their bodies distressed from daily life, people also enjoy charcoal-cooked foods.
(Junior Edu times) 

일상생활에서 지친 몸을 치유하는 동안, 사람들은 숯으로 요리한 음식들

## 네이버에서 경제

In [17]:
url='https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=101'
# 기본 세 줄을 붙여 넣으면 soup가 생성됩니다. 
headers = {"User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36'}
res = requests.get(url, headers = headers)
soup = BeautifulSoup(res.text, 'lxml')  

#def로 url을 입력하면 soup를 생성하는 함수 만들기 
def soupMaker(url):
    headers = {"User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36'}
    res = requests.get(url, headers = headers)
    return BeautifulSoup(res.text, 'lxml') 
    
soup = soupMaker(url)

# 특정 클래스 속성을 출력하기
for i in soup.find_all('div', {"class" : "sh_text"})[:10]:
    # 링크로 연결된 a태그의 텍스트 찾기
    url2 = i.find('a').get('href') #링크 주소 찾기 
    print(i.find('a').text, url2) 
    # 주소 얻기 
    soup2 = soupMaker(url2)
    for j in soup2.find_all('div', {"id" : "dic_area"}):
        try:
            print(j.text)
        except UnicodeEncodeError as e:
            print(f"Error encoding character: {e}")
        # 유니코드 인코드 에러는 챗GPT로 해결 

만족스럽다면 2000원 팁?…카카오택시 ‘팁 서비스’ 도입 https://n.news.naver.com/mnews/article/449/0000254163?sid=101

			[앵커]국내 최대 모빌리티 플랫폼이죠. 카카오T가 '팁 서비스'를 도입했습니다.  택시 서비스가 만족스럽다면, 2천 원까지 팁을 줄 수 있도록하는 건데, 여러분의 생각은 어떠십니까? 신선미 기자입니다. [기자]택시 플랫폼 카카오T가 '팁' 서비스를 도입했습니다.  적용 대상은 일반 택시를 제외하고 배차가 빠르거나 고급 차량이어서 웃돈을 내는 블랙과 벤티, 블루 택시입니다.제가 직접 이용해봤는데요. 결제 이후 서비스 평가에서 별점 5점을 줬더니 기존과는 다르게 '팁 결제' 창이 새롭게 뜹니다. 1000원부터 1500원, 2000원까지 3가지로 나눠 있고, '팁'을 줄지 말지는 개인의 선택입니다. 의무는 아니지만 승객들은 가뜩이나 오른 택시비에 팁 기능까지 생겨 부담입니다.  [안수정 / 경기 구리시] "야간 할증도 있고 택시가 안 잡히면 블루나 블랙이나 다른 것도 불러가지고 비싸게 돈을 내는데. 거기다 팁까지 내면 가까운 거리도 돈 1만원 이상 되니까 택시 타기 부담스러워질 거 같긴 해요."  카카오모빌리티는 카드 수수료를 제외한 팁 전액이 기사에게 전달돼 서비스 품질이 향상될 것이라고 설명했습니다.  기사들은 환영하는 분위기입니다.  [택시 운전사 A씨] "손님한테도 좀 더 친절하게 할 수도 있고, 그럼으로써 또 부가적으로 기사들이 얻는 것도 있고. 기대하고 있습니다."  하지만 팁 문화가 익숙지 않은 우리나라에서 팁 도입이 오히려 승객들의 반감을 살 것이란 우려도 나왔습니다.  [택시 운전사 B씨] "소비자들한테 왜 피해를 줘. 택시 타는 사람들이 괜히 그거에 관해서 부담을 갖지. 안 좋은 거예요"  카카오모빌리티는 팁을 강요하는 기사가 있다면 누적 횟수에 따라 경고나 배차 제한 조치를 취하겠다고 밝혔습니다.  채널A뉴스 신선미입니다.  영상취재 : 이락균 영상편집 : 이승은
		
평






부산 강서구 르노코리아자동차 부산공장에서 수출용 르노 XM3(수출명 아르카나)가 선적을 위해 이동하고 있다.  /한경DB지난 2분기 국내총생산(GDP)이 0.6% 증가했다. 1분기 0.3%에서 성장 폭을 키웠다. 하지만 소비와 투자, 수출과 수입이 모두 감소하면서 불황형 성장 우려는 외려 커졌다는 평가다.  불황형 성장 우려 커졌다25일 한국은행에 따르면 2분기 GDP를 구성하는 지출항목 중 8개 중 7개에서 마이너스를 기록했다. 가장 규모가 큰 민간소비는 -0.1%로 집계됐다. 1분기 0.6% 성장에서 마이너스로 전환됐다. 재화소비는 전분기 수준을 유지했지만 음식 숙박 등 서비스 소비가 줄어들었다.1분기 방역 조치 전환으로 소비가 몰렸던 기저효과가 2분기 성장에는 부담 요인으로 작용한 것으로 파악된다. 또 5월 황금연휴 시기 많은 비가 내려 소비가 기대만큼 이뤄지지 않은 점도 민간소비 감소에 영향을 줬다.정부소비는 -1.9%를 기록했다. 지난 1997년 1분기 -2.3% 이후 26년만에 최대 폭 감소다. 한은은 감염병 환자가 줄면서 건강보험 지출이 감소한 것을 감소 이유로 꼽았다. 1분기에 비해 독감환자와 코로나19 환자가 적었다는 것이다. 이같은 방역요인은 3분기 이후에는 해소될 것으로 봤다. 다만 정부 소비가 계속 감소할지, 다시 증가할지 여부는 정부의 재정지출 확대 여부에 달렸다고 설명했다.투자는 건설투자와 설비투자가 동반 감소했다. 건설투자는 토목건설 부문이 감소하면서 -0.3%, 설비투자는 운송장비 투자가 줄어들며 -0.2%를 각각 기록했다. 지식재산생산물 투자만 지출항목 중 유일하게 0.4% 증가한 것으로 집계됐다. 재고는 성장기여도가 -0.2%포인트를 기록했다.



자료=한국은행 경제금융 스냅샷 순수출이 1.3%포인트 끌어올려수출과 수입은 모두 감소 전환했다. 수출은 반도체와 자동차가 증가했으나, 석유제품과 운수서비스 등이 줄어 -1.8%를 기록했다. 전분기 4.5% 증가에 비하면 6.3%포인트나 감소했다. 수입은 이보다 감소폭이 큰 

# 공공데이터에서 데이터 찾기 
- 찾은 다음에 크롤링
- 특정한 저자의 논문 찾기 

In [15]:
import re 
Name = '김창현'
#국회도서관 api 키를 공공데이터서비스에서 받아서 사용 중(아직까지 트래픽 이슈는 없음)
url = 'https://apis.data.go.kr/9720000/searchservice/basic?serviceKey=7JlKxM7fEbOErQRa32MtR3%2Fg%2FBxi3JTPbwPfCw781Ma4uvwql5x2r2wM0Zh051RRUK%2Bw7YSwijxr0Tklej3cOg%3D%3D&pageno=1&displaylines=10&search=저자,'+Name 
urls = []
soup = BeautifulSoup(requests.get(url, verify=False, headers = headers).text, 'lxml')
 
dataset = [i.find('value').text for i in soup.find_all("item") ] 

for i in dataset[:10]:
    if re.search('[각-힣]+ [각-힣]+', i):
        print (i)
    else:
        pass

 



일용직 근로자 관리 / 서울약사회지. 서울약사회지.
일용직 근로자 관리 / 일용직근로자 일용근로소득지급명세서 주휴수당 약학
