반응형
C# -- IE automation #3 -- internet explorer 제어하여 html 소스 가져오기
환경 : windows 7 64bit, visual studio 2013 community
http://blog.clockahead.com/2015/06/cie-6.html
1. Internet explorer 를 제어하기 위해서는 SHDocVw 참조 필요하고, HTML 제어위해 MSHTML 참조 필요함.
SHDocVw -- Microsoft Internet Controls
MSHTML -- Microsoft HTML Object Library
2. References 에 MSHTML, SHDocVw 2가지 모두 추가됨.
3. Program.cs 의 소스
--- http://example.com/ 같은 간단한 페이지는 잘 출력되지만, 네이버처럼 페이지 로딩시간 긴것은 에러 발생하는 문제 발생한다.
<< 해결방안 >>
-- 해당 페이지 로딩이 완료될때까지 기다린후, html 을 읽어들인다.
위의 소스 19번 줄의
IE.Navigate2(ref url, ref Empty, ref Empty, ref Empty, ref Empty);
은 아래와 같이 간단하게 해도된다.
IE.Navigate2(ref url); // 간단한 표현
반응형
'C# Web Scraping' 카테고리의 다른 글
C# -- IE automation #6 -- 구글 검색창 제어하기 (0) | 2016.02.09 |
---|---|
C# -- IE automation #5 -- Attribute 제어하기 (0) | 2016.02.09 |
C# -- IE automation #4 -- html 구조 파헤치기 (0) | 2016.02.09 |
C# -- IE automation #2 -- Internet Explorer Architecture (0) | 2016.02.03 |
C# -- IE automation #1 -- 시작하기 (0) | 2016.02.02 |