Проблемы фильтрации и хранения информации

Разбирая свои закладки в inbox, RSS подписки и отложенные статьи в getpocket (суммарно около двух тысяч, при том что читаю минимум 20 статей в день) я не могу прекратить думать о структурировании и фильтрации информации.

Хорошо, если вас интересует только, например, разработка под Android. В таком случае потоком статей и ссылок очень легко управлять. Но так получается, что мои интересы достаточно разнообразны и находятся совсем в различных областях. Например, последние несколько статей в getpocket: организация сетей (для начинающих), патентное право, история русской революции, юникод для чайников, обсуждение fixed time step и variable time step применительно к разработке игр. Не буду отрицать того факта, что у кого-то этот разброс будет ещё шире, но такому человеку я могу только посочувствовать, потому что мои проблемы проявляются у него ещё острее.

Про фильтрацию

Самой первой и очевидной оптимизацией стало уменьшение внимания, которое уделяется статье. Например, я не собираюсь становиться специалистом, в проектировании сетей, но для общего развития, не особенно вникая в тонкости и детали, хотя бы пролистать и уловить современные тенденции и разработки — интересно. Но эта оптимизация имеет определённый лимит, превысив который на статью уже не имеет смысла обращать внимания, потому что никакой полезной информации не усваивается.

Затем я ввёл для себя систему приоритетов. Статьи про gamedev — на первое место, статьи по текущим технологиям, которые применяются в работе туда же и т.д. Этот параметр можно усиливать до бесконечности, но внутри всегда свербит, что интересные вещи могут пролететь.

На фильтрацию теперь стало затрачиваться очень много времени. Я могу потратить час и за него так и не разобрать все RSS, отчасти, поэтому там и накапливается такое количество. Редко когда получается выделить целый час на разбор завалов, а если это делать раз в неделю, то легко можно просидеть и полдня, что часто просто физически невозможно.

Есть у меня небольшая хитрость, когда в отсутствие времени статьи помещаются в inbox с минимальной фильтрацией (просто отсеиваются заведомо совсем не интересные), а потом, когда появляется достаточное количество времени, фильтруется уже inbox. Устаревшие, исчезнувшие и уже не актуальные статьи быстро отсеиваются, но на входе всё равно остаётся слишком большой массив информации.

Как было бы здорово, если кто-нибудь разработал систему, которая будет каким-то образом эвристически фильтровать входной поток. Правда, как бороться и отслеживать ошибки я пока не представляю. Конечно, можно сказать, что если статья пропала, ну и чёрт с ней, хорошая попадётся снова, но некая полезная узкоспециализированная статья вполне может пролететь незамеченной на долгое время.

Дальнейшую оптимизацию фильтрации я пока что вижу только в усилении фильтра по приоритетам.

Про хранение

Часто бывает, что для поиска некоторой информации в гугле пришлось приложить некоторые усилия.

Например, поиск сайта с бесплатной музыкой, которую можно использовать в своей игре. Таких сайтов несколько, но стоящих единицы. Для того чтобы выбрать хороший сервис приходится пробовать десяток. Результат такого отбора хочется сохранить в виде закладки. Предположим, сохранили.

Далее, ищем сервис для онлайн тестирования регулярных выражений. Их уже не десяток, а, не знаю, сотня. Хорошо, тоже выбрали. Сохранили как закладку.

Проходит год и уже в браузере сотня-другая закладок на все случаи жизни. Сайт с музыкой, как и сервис для регулярок не нужны каждый день. Раз в месяц, раз в полгода, некоторые сервисы вообще раз в год. При таких сроках, конечно, уже забывается что сохранял, куда сохранял, сохранял ли вообще и начинаешь искать по новой и только потом, уже найдя то что нужно, обнаруживаешь что это есть в закладках. Иногда это несколько часов потерянных впустую при очередном поиске.

Решения этой проблемы я так и не придумал. Просто перестал сохранять в закладки. В качестве побочного эффекта добавилась возможность при повторном поиске найти что-то новое и лучше, но это не очень большое утешение.

Вообще, интересно было бы почитать кто как справляется с такими проблемами (почитать…WAIT…OH SHI~).

  • по поводу закладок, мне кажется, их стоит использовать, просто это вопрос выбора инструмента для их менеджмента. В частности, закладки, выстраивающиеся в дерево, поддерживающие больше одного тега на одну закладку и т.п. вполне себе функциональны. Я их активно использую, правда, стоит упомянуть, что я делаю это через командную строку и автодополнение (pentadactyl в firefox).

    кроме того, я не сохраняю в закладки что-то на очень длительный срок, поскольку придерживаюсь парадигмы «если это мне может понадобиться потом, я смогу найти это через гугл». например, «самые быстрые регэкспы в python». я просто помню, как кратко охарактеризовать ту или иную вещь, и уверен, что смогу найти ее через гугл спустя год-другой.

    фильтрация информации меня тоже не очень беспокоит, потому что менее значимое я просто пролистаю быстрее и не потрачу на это много времени. а что-то очень специфическое меня не очень пугает, если оно интересно, почему бы не прочесть, если не интересно, пропущу. ну и просто я первым открываю rss более важные/интересные, чем что-то другое.

    устаревшие новости по большому счету можно вообще не читать и не париться на этот счёт. равно как и насчёт «а вдруг нужное меня минует». я для себя давно сделал вывод, что с текущим кол-вом подписок, аккаунтов, соцсетей и т.п. нужное всё равно прилетит ко мне сразу по нескольким каналам, поэтому нет смысла беспокоиться, пропущу ли я его по одному из них.

    • ну это так, мысли вслух на сходные темы, может, и не на те же самые. -)

    • Про утилиту для управления закладками с командной строкой, автодополнением и тому подобным — мысль интересная. Интересно, есть ли что нибудь такое для Google Chrome с интеграцией с уже существующими закладками.

      • эта «утилита» — pentadactyl. очень рекомендую попробовать хотя бы ради интереса. замечательный аддон.

        к сожалению, он есть только в фоксе. в остальных браузерах есть аналоги, но они имплементируют лишь очень небольшую часть функционала.