수집 방법론
수집 범위
- 언어: 한국어, 영어
- 키워드: 아카이브, 아카이빙, archive, archiving, archived
- 기간: 2026년 4월~
수집 소스
| 소스 | 방식 | 주기 |
|---|---|---|
| Google News | RSS 자동 수집 | 매일 |
| 네이버 뉴스 | API 자동 수집 | 매일 |
| Bluesky | API 자동 수집 | 매일 |
| Are.na | 수동 수집 | 비정기 |
자동 수집 프로세스
- GitHub Actions가 매일 09:00 KST에 실행
- 각 소스에서 키워드 검색
- 중복 제거 후 JSON 저장
- 자동 커밋
분류 체계 (검토 후 적용)
수집된 용례는 검토 후 다음 카테고리로 분류될 예정:
- 마케팅 — 브랜드, 컬렉션, 빈티지 마케팅
- 예술 — 전시, 미술관, 큐레이션
- 제도 — 공공기록, 도서관, 법적 보존
- 시민 — 커뮤니티 기록, 구술, 풀뿌리
- 감성 — 추억, 향수, 개인 저장
데이터 스키마
{
"id": "ghost-2026-04-26-xxxxx",
"source_type": "news | bluesky",
"source_url": "https://...",
"source_title": "제목",
"collected_at": "2026-04-26",
"published_at": "2026-04-26",
"keyword": "아카이브",
"language": "ko | en",
"auto_collected": true,
"reviewed": false,
"category": null,
"implied_meaning": null,
"note": null
}
참고 사례
- Bad Archives — 문제적 아카이브 사례 수집
- Word Watch — 단어 용례 수집
- Digital Gardens — 디지털 가든 사례 수집
오픈소스
수집 스크립트와 데이터는 모두 GitHub에 공개되어 있다.