forked from boostcampwm-2024/web05-Denamu
-
Notifications
You must be signed in to change notification settings - Fork 0
[개발 위키] rss old feed 데이터 불러오기에 대한 윤리적 문제
kimhji edited this page Feb 3, 2025
·
1 revision
feed 수가 많은 tistory rss 업로드(2025-01-09 기준 622개)를 승인 했으나, 50개의 feed 만 포함됨을 확인
→ 코드엔 최대 feed 수를 제한하는 부분이 없는 것을 확인함.
→ rss url 확인 결과 최신 50개의 xml 데이터 만을 포함함.
→ 이전 데이터를 가져올 순 없는가?
대부분의 rss 데이터는 10~25개의 피드 만을 최대로 포함함.
- tistory의 경우 작성자가 rss 최대 공개 피드를 설정할 수 있음.
이전 데이터를 불러오기 위해선 비공식 google reader 와 같은 library 등을 사용할 수 있으나, 작성자가 아닌 타인이 rss를 통해 모든 게시물을 가져오도록 하는 방식은 도의적/법적 문제가 발생 가능.
- rss는 작성자의 허락을 받지 않고 가져올 수 있으며, 개인 정보가 포함된 경우에는 더더욱 개인정보 보호법 위반에 의거하여 신고 받을 수 있음.
- 이를 방지하기 위해선 본인의 rss 요청만을 승인할 수 있도록 추가적인 인증 절차나, 신고 절차가 필요할 듯 싶음.
서비스가 더 오래되면, 이전에 upload된 rss의 경우 지속적으로 feed를 업데이트 하기에 오래된 feed 데이터를 가지고 있을 수 있으나 최근 배포된 서비스로써는 그 이전의 데이터를 가지고 올 수 없다는 아쉬움이 있음.
그러나 이전 데이터를 가져올 수 있는 비공식적인 api를 사용하거나, 이를 참조하여 오래된 데이터를 임의로 가져올 수 있는 방식을 사용하는 것은 개인정보 보호를 침해하는 문제로 이어질 수 있어서 일단 유지하는 것으로 결론 내림.
참고자료
https://stackoverflow.com/questions/576552/how-do-i-fetch-all-old-items-on-an-rss-feed
프로젝트 문서
트러블슈팅
프로젝트 문서
- 검색 쿼리 속도 개선
- 검색 쿼리 pagination cursor 방식 명세
- 검색 쿼리 pagination cursor 방식 적용을 통한 속도 개선
- ai 홍보용 요약 기능 구현
- feed 홍보용 요약 명세
트러블슈팅
프로젝트 문서
트러블슈팅
프로젝트 문서
트러블슈팅
프로젝트 문서
- TanStack Query로 복잡한 서버 상태 관리하기
- useCallback으로 불필요한 렌더링 제거하기
- Zustand persist로 상태 데이터 쟁여두기
- UseQueryOptions에 관하여
- 커서 페이지네이션으로 책갈피 펴듯 데이터 탐색하기
- Google Analytics로 사용자 행동 추적하기
트러블슈팅