크롤링2
크롤링을 하다보면 (scrape이 더 맞는 표현이더군) 텍스트 출력(csv 포함)만으로 부족한 경우가 있다. 긴 문장이 하나의 필드로 들어가야 하는 경우가 종종 있어서 엑셀로 저장하는 것이 훨씬 유리하다. 아니, csv로 받아서는 아예 답이 안나온다. 엑셀로 저장하기 위해 panda library를 사용한다. 기본 사용법은 우선 여기를 참조(https://korbillgates.tistory.com/148) 여려 페이지의 데이터를 스크래이핑 할 때는 페이지마다 저장을 하는게 좋다. 안그랬다간 시간만 잡아 먹고 남은게 하나도 없게 되는 일이... 중간중간 저장을 위해서는 다음과 같은 방법이 필요하다. https://stackoverflow.com/questions/47737220/append-datafra..
해피 코딩
2019. 8. 17. 17:40
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- mba
- 계획
- 개발자
- 퀀트
- LearnByArticle
- react-native
- wp
- 알고리즘문제
- til
- 경영
- 중년개발자이야기
- pyTorch
- yocto
- 개발일지
- Poky
- 자동거래
- 일기
- diary
- AWS
- 행안부
- 코딩인터뷰
- 개발노트
- 바질
- 저널
- Journal
- node_modules
- 중년
- 바질키우기
- React
- firebase
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함