데이터수집
작성자 정보
- 조아컴퍼니 작성
- 작성일
본문
카테고리 | 데이터수집 | 제작기간 | 협의 |
---|---|
서버환경 | web,api서버 |
기타내용 | 데이터자동 업무처리 크롤링 |
상세 내용
데이터 파싱 작업은 일반적으로 비정형 또는 반정형 데이터(HTML, JSON, XML, 텍스트 등)에서 원하는 정보를 추출하여
구조화된 형태(예: 테이블, CSV, DB 등)로 변환하는 작업입니다.
✅ 예를 들어:
게시판 주소: https://example.com/board?page=1
추출할 데이터:
-
게시글 제목
-
작성자
-
날짜
-
조회수
-
본문 내용
✅ 게시판 구조에 따라 달라지는 점
-
HTML 구조가 다르면 셀렉터(css 선택자)를 수정해야 합니다.
-
로그인/쿠키 필요 여부 (로그인 기반 게시판인 경우 세션 유지 필요)
-
JavaScript로 렌더링된 사이트인 경우 Selenium이나 Playwright 필요
관련자료
-
다음
댓글 0
등록된 댓글이 없습니다.