재수집 요청 V2
기존 데이터셋을 같은 ID로 재수집합니다.
이미 만들어진 데이터셋을 새 데이터셋으로 만들지 않고 같은 schedule_result_id로 다시 수집합니다. 데이터셋의 파라미터(스냅샷)와 결과 컬럼 설정은 처음 수집 시점 그대로 유지되며, 기존에 쌓인 결과는 그대로 유지된 채 이번 재수집으로 얻은 결과가 같은 데이터셋에 추가됩니다.
재수집은 새 수집 작업을 큐에 추가하므로 collect와 동일하게 이용권/크레딧 검사를 거칩니다. 이용권 기간이 만료되었거나 보유 크레딧이 부족하면 요청이 거부되며, 이 경우 응답 키는 error_message로 내려옵니다.
요청 후 진행 상태는 collect_status에서 같은 schedule_result_id로 확인할 수 있습니다.
요청 파라미터
-
api_key: String해시스크래퍼 API 키API키 확인하기
-
schedule_result_id: Integer재수집할 데이터셋 ID. 보통
collect응답으로 받은 값을 그대로 전달합니다.
응답 필드
-
result: String요청 처리 결과.
-
version: StringAPI 버전.
-
retry_info: Object재수집 요청 결과 정보.
-
schedule_result_id: Integer재수집된 데이터셋 ID. 요청 시 전달한 값과 동일합니다.
-
schedule_id: String이 데이터셋이 속한 스크래퍼의 식별자.
collect와 달리 요청값을 그대로 echo하지 않고, 서버에 저장된 값을 반환합니다. -
param_info: Object이 데이터셋이 처음 수집된 시점의 파라미터 스냅샷. 사용으로 지정된
param1~param5만 포함되며, 키 이름에 라벨이 함께 표기됩니다 (예:param1(검색어)). 스크래퍼에 라벨이 설정되지 않았으면param1()또는param1(param1)처럼 라벨 자리가 비거나 placeholder로 남을 수 있습니다.
-
-
elapsed_time: Float응답 생성에 걸린 시간(초 단위 숫자).
에러 응답
-
schedule_result_id missing
{ "result": "error", "version": "v2", "message": "`schedule_result_id` parameter is required" } -
Schedule result not found
{ "result": "error", "version": "v2", "message": "schedule_result(id: YOUR_SCHEDULE_RESULT_ID) not found" } -
Service ticket expired
{ "result": "error", "version": "v2", "error_message": "서비스 이용권의 기간이 만료되었습니다." } -
Credit exhausted
{ "result": "error", "version": "v2", "error_message": "보유하신 크레딧을 모두 사용하셨습니다." } -
Retry blocked
{ "result": "error", "version": "v2", "message": "Retry blocked: ..." }
관련 가이드
요청 예시
응답 예시 200
{
"result": "success",
"version": "v2",
"retry_info": {
"schedule_result_id": 13229289,
"schedule_id": "사람인_채용공고_수집_1697441449957",
"param_info": {
"param1(검색할 키워드)": "개발자",
"param2(최대 수집 개수)": "10"
}
},
"elapsed_time": 0.4521
}