Виталий Власов: Открытые данные — как с ними дружить

2804 просмотров

«ЛИВЕНЬ. Living Asia» собирает практические советы для журналистов и экоактивистов о том, что такое открытые данные. Какое место данные занимают в мире, через какие шаги упростить свою работу с большими массивами информации рассказывает программист из Санкт-Петербурга, евангелист открытых данных и один из тренеров первого центральноазиатского DataLab по использованию данных в экологических темах  – Виталий Власов.


Часть I. ОТКРЫТЫЕ ДАННЫЕ — ЧТО ЭТО?

  1. Открытые данные – это информация о деятельности государственных органов, размещенная в Интернете в виде массивов данных в машиночитаемом формате на условиях свободного (бесплатного) использования.

Машиночитаемость – формат, обеспечивающий автоматическую обработку данных для повторного их использования без предварительного изменения человеком.

  1. Неструктурированная информация оформляется в doc, pdf, html, структурированная – в XLS, CSV, RDF, OWL, XML – более приспособленных форматах.

  2. Как быть журналистам и активистам, которые не умеют обращаться с данными? Программисты позаботились об этом – сегодня создано огромное количество сервисов, которые позволяют работать с массивами данных не подготовленному человеку.

  3. Тим Бернес-Ли – создатель Интернета — одним из первых поднял тему открытых данных, семантического веба и рейтинга 5 звезд.

Семантический веб — часть глобальной концепции развития Интернета, целью которой является реализация возможности машинной обработки информации, доступной в сети (из Википедии)

Рейтинг 5 звезд – рейтинг, по которому люди, опираясь на опубликованные данные, могут оценить работу власти по пятибалльной школе.

  1. Из данных надо делать истории – без них цифры не будут интересны людям.

  2. Хорошие и плохие данные.
  3. Почему тема открытых данных в последние годы возникла на международной арене? 5-6 лет назад ее начали активно обсуждать в США. Было сформировано так называемое Партнерство за открытое правительство, куда вошли многие страны. Подписано много соглашений. В мире существует целое движение за открытые данные, мы – его полноценные участники.

Третий президент США Томас Джефферсон сказал, что информация – валюта демократии. Я бы сказал, что данные – валюта демократии.

  1. Открытые данные – это возможность создавать инновационные решения не только в правительстве, но и во многих других отраслях. Ряд стран проводит исследования о том, как можно монетизировать массивы данных.

  2. Международная консалтинговая компания McKinsey провела исследование: если концепция открытых данных будет реализована в Европейском союзе, то она создаст экономический эффект в 3 трлн. долларов в год. Они сделали разбивку на сектора: образование, транспорт, продукция и подсчитали обороты в каждом из них.
  3. Журналистика данных – одно из практических применений открытых данных.

Проект Dollars for doctors – один из ярких примеров журналистики данных. В независимом американском издании Propublica собрали данные о том, сколько фармацевтические компании платят врачам за разные услуги, в единую базу. Любой человек может ввести имя своего врача и узнать, за что ему заплатила та или иная компания и понять, связан ли прописанный ему препарат с оплаченной рекламой. Проект наделал много шума, многие врачи отказались от практики продвигать свои продукты таким образом.

  1. Немного полезных ссылок.

Часть II. КАК ОРГАНИЗОВАТЬ РАБОТУ С ДАННЫМИ

  1. Создайте рабочее пространство, главное – структура.
  1. Проведите мозговой штурм.

Эффективнее всего собрать команду и вместе с ней «штурмовать » — это позволит мыслить нестандартно.


  1. Следите за временем, планируйте свою работу.И не забывайте делать перерывы.

  1. Работайте с MVP.

Определите, для кого именно вы делаете продукт, какую проблему он решает и как будет выглядеть (статья, инфографика, сервис, онлайн база данных).

MVP (minimum viable product) — это минимально жизнеспособный продукт, который позволяет получить осмысленную обратную связь от аудитории, понять что ей нужно и не создавать то, что им неинтересно (из stfalcon.com)

Советы для MVP:

  • напишите все, что хотите реализовать;
  • подумайте, без чего совсем не обойтись;
  • выкиньте все остальное.

  1. Данных по экологии много, вот где их искать (например).
  1. Не накапливайте информацию, структурируйте ее сразу.
  2. Используйте Burndown диаграмму.

    Burndown диаграмма, или Диаграмма сгорания задач показывает количество сделанной и оставшейся работы (из Википедии).

  1. Формируйте свою базу данных.

Сохраните по максимуму материалов и ссылок, найденных во время работы (используйте электронный блокнот Evernote)


  1. Создавайте базу знаний», а не «базу данных».

Общайтесь с экспертами, формализуйте предметную область, станьте сами экспертом.


  1. Используйте открытые лицензии.

Creative Commons в помощь.

ЧИТАЙТЕ ТАКЖЕ

В рубрике «Базы данных» вы можете найти и использовать в своих материалах данные по экологическим темам, разбитые по тематическим секторам и странам Центральной Азии.


Изображения из презентаций Виталия Власова
Введение в открытые данные и Напутствие джедаям 

Об этом тоже важно знать