Python
네이버 실시간 검색어 파싱
kcrong
2015. 4. 28. 13:27
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | #-*-coding:utf-8-*- from socket import * s=socket(AF_INET,SOCK_STREAM) s.connect(("www.naver.com",80)) s.send("GET / HTTP/1.1\nHost:www.naver.com\n\n") get=s.recv(4096) for i in range(0,20): get+=s.recv(4096) # 실시간 검색어 부분을 찾는다. index=get.find("<select name=\"query\">") get=get[index+len("<select name=\"query\">"):index+700] # "> 와 </option> 사이의 문자열을 파싱하고, 파싱한 부분은 넘어간다. <-- 이걸 10번 반복. for i in range(0,10): print get[get.find("\">")+2:get.find("</option>")] get=get[get.find("</option>")+len("</option>"):] | cs |
시험공부중에 잠시 쉴겸 만든 실시간 검색어 파싱기.
그냥 빨리 짠다는 생각에 소스가 매우 더럽다.