본문 바로가기

Python

네이버 실시간 검색어 파싱

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#-*-coding:utf-8-*-
from socket import *
 
s=socket(AF_INET,SOCK_STREAM)
s.connect(("www.naver.com",80))
s.send("GET / HTTP/1.1\nHost:www.naver.com\n\n")
 
get=s.recv(4096)
for i in range(0,20):
    get+=s.recv(4096)
 
# 실시간 검색어 부분을 찾는다.
index=get.find("<select name=\"query\">")
get=get[index+len("<select name=\"query\">"):index+700]
 
# "> 와 </option> 사이의 문자열을 파싱하고, 파싱한 부분은 넘어간다. <-- 이걸 10번 반복.
for i in range(0,10):
    print get[get.find("\">")+2:get.find("</option>")]
    get=get[get.find("</option>")+len("</option>"):]
 
cs






시험공부중에 잠시 쉴겸 만든 실시간 검색어 파싱기.

그냥 빨리 짠다는 생각에 소스가 매우 더럽다.

'Python' 카테고리의 다른 글

scapy 를 이용한 ARP 패킷  (0) 2015.05.02
scapy 이용 arp 패킷 보내기.  (0) 2015.05.01
파이썬 게임 서버개발 - 1  (0) 2015.04.27
쓰레드를 이용한 소켓  (0) 2015.04.27
scapy - 패킷 제작  (0) 2015.04.27