«ЛИВЕНЬ. Living Asia» собирает практические советы для журналистов и экоактивистов о том, что такое открытые данные. Какое место данные занимают в мире, через какие шаги упростить свою работу с большими массивами информации рассказывает программист из Санкт-Петербурга, евангелист открытых данных и один из тренеров первого центральноазиатского DataLab по использованию данных в экологических темах – Виталий Власов.
Часть I. ОТКРЫТЫЕ ДАННЫЕ — ЧТО ЭТО?
- Открытые данные – это информация о деятельности государственных органов, размещенная в Интернете в виде массивов данных в машиночитаемом формате на условиях свободного (бесплатного) использования.
Машиночитаемость – формат, обеспечивающий автоматическую обработку данных для повторного их использования без предварительного изменения человеком.
- Неструктурированная информация оформляется в doc, pdf, html, структурированная – в XLS, CSV, RDF, OWL, XML – более приспособленных форматах.
- Как быть журналистам и активистам, которые не умеют обращаться с данными? Программисты позаботились об этом – сегодня создано огромное количество сервисов, которые позволяют работать с массивами данных не подготовленному человеку.
- Тим Бернес-Ли – создатель Интернета — одним из первых поднял тему открытых данных, семантического веба и рейтинга 5 звезд.
Семантический веб — часть глобальной концепции развития Интернета, целью которой является реализация возможности машинной обработки информации, доступной в сети (из Википедии)
Рейтинг 5 звезд – рейтинг, по которому люди, опираясь на опубликованные данные, могут оценить работу власти по пятибалльной школе.
- Из данных надо делать истории – без них цифры не будут интересны людям.
- Хорошие и плохие данные.
- Почему тема открытых данных в последние годы возникла на международной арене? 5-6 лет назад ее начали активно обсуждать в США. Было сформировано так называемое Партнерство за открытое правительство, куда вошли многие страны. Подписано много соглашений. В мире существует целое движение за открытые данные, мы – его полноценные участники.
Третий президент США Томас Джефферсон сказал, что информация – валюта демократии. Я бы сказал, что данные – валюта демократии.
- Открытые данные – это возможность создавать инновационные решения не только в правительстве, но и во многих других отраслях. Ряд стран проводит исследования о том, как можно монетизировать массивы данных.
- Международная консалтинговая компания McKinsey провела исследование: если концепция открытых данных будет реализована в Европейском союзе, то она создаст экономический эффект в 3 трлн. долларов в год. Они сделали разбивку на сектора: образование, транспорт, продукция и подсчитали обороты в каждом из них.
- Журналистика данных – одно из практических применений открытых данных.
Проект Dollars for doctors – один из ярких примеров журналистики данных. В независимом американском издании Propublica собрали данные о том, сколько фармацевтические компании платят врачам за разные услуги, в единую базу. Любой человек может ввести имя своего врача и узнать, за что ему заплатила та или иная компания и понять, связан ли прописанный ему препарат с оплаченной рекламой. Проект наделал много шума, многие врачи отказались от практики продвигать свои продукты таким образом.
- Немного полезных ссылок.
Часть II. КАК ОРГАНИЗОВАТЬ РАБОТУ С ДАННЫМИ
- Создайте рабочее пространство, главное – структура.
- Проведите мозговой штурм.
Эффективнее всего собрать команду и вместе с ней «штурмовать » — это позволит мыслить нестандартно.
- Следите за временем, планируйте свою работу.И не забывайте делать перерывы.
- Работайте с MVP.
Определите, для кого именно вы делаете продукт, какую проблему он решает и как будет выглядеть (статья, инфографика, сервис, онлайн база данных).
MVP (minimum viable product) — это минимально жизнеспособный продукт, который позволяет получить осмысленную обратную связь от аудитории, понять что ей нужно и не создавать то, что им неинтересно (из stfalcon.com)
Советы для MVP:
- напишите все, что хотите реализовать;
- подумайте, без чего совсем не обойтись;
- выкиньте все остальное.
- Данных по экологии много, вот где их искать (например).
- Не накапливайте информацию, структурируйте ее сразу.
- Используйте Burndown диаграмму.
Burndown диаграмма, или Диаграмма сгорания задач показывает количество сделанной и оставшейся работы (из Википедии).
- Формируйте свою базу данных.
Сохраните по максимуму материалов и ссылок, найденных во время работы (используйте электронный блокнот Evernote)
- Создавайте базу знаний», а не «базу данных».
Общайтесь с экспертами, формализуйте предметную область, станьте сами экспертом.
- Используйте открытые лицензии.
Creative Commons в помощь.
ЧИТАЙТЕ ТАКЖЕ
В рубрике «Базы данных» вы можете найти и использовать в своих материалах данные по экологическим темам, разбитые по тематическим секторам и странам Центральной Азии.
Изображения из презентаций Виталия Власова
Введение в открытые данные и Напутствие джедаям