Plaggerなどのスクレイピングツールで、ブログやニュースを取得することのメリットとデメリットを考える

メリット

  • 本文すべて取得しGmailに送信することで、あとから全文検索ができる。
  • ローカルのメーラーで読むのは、環境次第ではとても速い。
    • MySQLなどのDBに放り込んで、自分でつくったソフトで読むのもいいね。というかそれもやっている。
  • ある時間軸にそってフィードを読むことができる。
    • たとえば「今日の15時の時点」でのフィードを読む、といったふうに。
    • 時間軸ごとの優先付けが出来る。
      • たとえば「今日の10時以前の分は後回しにしてそれ以降のフィードから先に読む」など。
  • ブログやニュースの元の記事が消えても、手元に記事が残る。
    • アーカイブして永久保管。記憶の補助、ナレッジベース、思い出作り、証拠作りといった目的に使える。
    • すでに消えたはずの記事の内容も全文検索の対象になる。
    • ソーシャルブックマークやWeb魚拓が消えても手元には記事が残る。

デメリット

  • Web型のフィードリーダーと比較すると未読管理がちょっと難しい。
  • メーラーの受信時間が長くなる。1週間分ためておいたところダウンロードに3時間近くかかってしまった。
  • Gmailの容量があっという間に満杯になる。1ヶ月は持つが3ヶ月だとアウト。
    • ローカルのHDDにもそれなりの空き容量が必要になる。


まだ他にもいろいろ考えられそうです。

あくまで自分の場合は、という前提で思いつくままに書いてみました。ちなみに購読フィード数は約2,000です。