Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Вас отследят

Инфраструктура массовой слежки набирает обороты. Вчера я показал, как IBM с его BAO умеет обработать 20млн. документов и 200млн. наименований хим.соединений в них -- представляя с этой технологией сервисы по отслеживанию мелких трендов (сценарий типа "сервис-служба на одном континенте получила жалобу на деталь XYZ через чат, на другом континенте об этом пришло письмо, а на третьем континенте это было упомянуто в отчёте. Наш софт заметит, что это тренд -- софрмулирует и представит его для дополнительного расследования", см. http://public.dhe.ibm.com/common/ssi/ecm/en/lbs03010usen/LBS03010USEN.PDF и другие документы на http://www.ibm.com/software/ecm/content-analytics/).

Но переделать это на структуру слежки -- просто разработать алгоритмы для этого. Ибо инфраструктура "больших неструктурированных данных на естественном языке" уже есть, и даже в некотором изобилии. Вот, например, место, где разрабатывают алгоритмы корпоративной и/или правительственной слежки -- с возможностью обработки до 250млн. сообщений в день с целью обнаружить паттерны "странного поведения". Эдакая "база знаний электронного копа", которая залезает ровно на те же данные и базируется ровно на той же аналитической инфраструктуре, на которые при предыдущем проходе клались задачи обнаружения типовых клиентских жалоб для запуска механизма непрерывного совершенствования качества -- http://gcn.com/articles/2011/12/06/darpa-prodigal-email-monitoring-insider-threats.aspx (оригинальный пресс-релиз с чуть меньшим количеством информации и более невнятными словами о целях и механизмах -- http://www.gatech.edu/newsroom/release.html?nid=72599).

И никакого скайнета, машины только на службе отдельных человеков.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 12 comments