수집 상태 조회 V2

POST api.hashscraper.com/api/get_collection_status Content-Type: application/json; version=2

특정 데이터셋의 수집 진행 상태와 메타데이터를 조회합니다.

collect 응답으로 받은 schedule_result_id로 해당 데이터셋의 진행 상태를 조회합니다. 수집 중에는 같은 ID로 반복 호출하면서 진행 상황을 확인할 수 있습니다.

data_countsr_status는 호출 시점 기준 실시간 값입니다. 진행 중에는 호출마다 값이 변할 수 있습니다.

latest_schedule_result_id는 같은 스크래퍼의 가장 최근 데이터셋 ID입니다. 요청한 ID와 다르면 더 최근에 다른 수집이 트리거되었다는 의미이므로, 최신 데이터를 보고 싶다면 그 ID로 다시 조회하세요.

요청 파라미터

  • api_key: String
    해시스크래퍼 API 키API키 확인하기
    예시 YOUR_API_KEY
  • schedule_result_id: Integer
    조회할 데이터셋 ID. collect 응답의 schedule_result_id를 그대로 전달합니다.
    예시 YOUR_SCHEDULE_RESULT_ID

응답 필드

  • result: String
    요청 처리 결과.
    허용값 success, error
  • version: String
    API 버전.
    예시 v2
  • collection_status: Object
    수집 상태 정보.
    • id: Integer
      조회된 데이터셋 ID. 요청 시 전달한 값과 동일합니다.
    • sr_status: String
      수집 진행 상태. 일반적으로 받게 되는 값은 ready(시작 대기), running(수집 중), retry(재시도 중), finish(완료), canceling(취소 진행 중)이며, 일부 legacy 데이터에서는 한국어 라벨이 반환될 수 있습니다.
    • data_count: Integer
      현재까지 수집된 결과 건수. 호출 시점의 실시간 값으로, 진행 중에는 호출마다 증가할 수 있습니다.
    • created_at: String (ISO 8601)
      데이터셋 생성 시각 (ISO 8601, Asia/Seoul).
    • updated_at: String (ISO 8601)
      데이터셋 마지막 갱신 시각 (ISO 8601, Asia/Seoul).
    • param_info: Object
      이 수집의 파라미터 스냅샷. 사용으로 지정된 param1~param5만 포함되며, 키 이름에 라벨이 함께 표기됩니다 (예: param1(검색어)). 스크래퍼에 라벨이 설정되지 않았으면 param1() 또는 param1(param1)처럼 라벨 자리가 비거나 placeholder로 남을 수 있습니다.
    • no_result: Boolean | null
      스크래퍼의 "결과 없음" 처리 설정 스냅샷. 스크래퍼 설정이 없거나 파싱이 실패하면 null일 수 있습니다.
    • union: Boolean | null
      스크래퍼의 유니온 결과 사용 여부 스냅샷. 동일하게 null일 수 있습니다.
    • latest_schedule_result_id: Integer
      이 스크래퍼의 가장 최근 데이터셋 ID. 요청한 schedule_result_id와 비교해 더 새 수집이 있는지 판단할 수 있습니다.
  • elapsed_time: Float
    응답 생성에 걸린 시간(초 단위 숫자).
    예시 0.0153

에러 응답

  • schedule_result_id missing
    필수 파라미터 schedule_result_id가 누락되었습니다.
    {
      "result": "error",
      "version": "v2",
      "message": "`schedule_result_id` parameter is required"
    }
  • Schedule result not found
    전달된 schedule_result_id로 데이터셋을 찾을 수 없거나 접근 권한이 없습니다.
    {
      "result": "error",
      "version": "v2",
      "message": "schedule_result(id: YOUR_SCHEDULE_RESULT_ID) not found"
    }

관련 가이드

요청 예시
  • cURL
  • Ruby
  • Python
  • NodeJS
  • PHP
  • Java
응답 예시 200
{
  "result": "success",
  "version": "v2",
  "collection_status": {
    "id": 13229289,
    "sr_status": "running",
    "data_count": 5,
    "created_at": "2026-04-28T10:32:19.000+09:00",
    "updated_at": "2026-04-28T10:32:52.000+09:00",
    "param_info": {
      "param1(검색할 키워드)": "개발자",
      "param2(최대 수집 개수)": "10"
    },
    "no_result": false,
    "union": false,
    "latest_schedule_result_id": 13229289
  },
  "elapsed_time": 0.0153
}