Skip to content

[개발 위키] rss old feed 데이터 불러오기에 대한 윤리적 문제

kimhji edited this page Feb 3, 2025 · 1 revision

문제 확인

feed 수가 많은 tistory rss 업로드(2025-01-09 기준 622개)를 승인 했으나, 50개의 feed 만 포함됨을 확인

→ 코드엔 최대 feed 수를 제한하는 부분이 없는 것을 확인함.

→ rss url 확인 결과 최신 50개의 xml 데이터 만을 포함함.

→ 이전 데이터를 가져올 순 없는가?

해결 방안 고민

대부분의 rss 데이터는 10~25개의 피드 만을 최대로 포함함.

  • tistory의 경우 작성자가 rss 최대 공개 피드를 설정할 수 있음.

이전 데이터를 불러오기 위해선 비공식 google reader 와 같은 library 등을 사용할 수 있으나, 작성자가 아닌 타인이 rss를 통해 모든 게시물을 가져오도록 하는 방식은 도의적/법적 문제가 발생 가능.

  • rss는 작성자의 허락을 받지 않고 가져올 수 있으며, 개인 정보가 포함된 경우에는 더더욱 개인정보 보호법 위반에 의거하여 신고 받을 수 있음.
  • 이를 방지하기 위해선 본인의 rss 요청만을 승인할 수 있도록 추가적인 인증 절차나, 신고 절차가 필요할 듯 싶음.

임시적인 타협 방안

서비스가 더 오래되면, 이전에 upload된 rss의 경우 지속적으로 feed를 업데이트 하기에 오래된 feed 데이터를 가지고 있을 수 있으나 최근 배포된 서비스로써는 그 이전의 데이터를 가지고 올 수 없다는 아쉬움이 있음.

그러나 이전 데이터를 가져올 수 있는 비공식적인 api를 사용하거나, 이를 참조하여 오래된 데이터를 임의로 가져올 수 있는 방식을 사용하는 것은 개인정보 보호를 침해하는 문제로 이어질 수 있어서 일단 유지하는 것으로 결론 내림.

참고자료

https://stackoverflow.com/questions/5761954/retrieving-rss-posts-older-than-those-included-in-feed?rq=1

https://stackoverflow.com/questions/576552/how-do-i-fetch-all-old-items-on-an-rss-feed

🎋DENANNU

👮🏻 팀 규칙

*️⃣ 기술로그

공통

프로젝트 문서

트러블슈팅

김현지

프로젝트 문서

트러블슈팅

양현호

프로젝트 문서

트러블슈팅

정지혜

프로젝트 문서

트러블슈팅

한영준

프로젝트 문서

트러블슈팅

🗓️ 주간 스프린트 기록

📚 회의록

🍵 주간회고

Clone this wiki locally