Виступ на Форумі електронного врядування 451 °Е у Львові

Про відкриті дані, проблеми навколо них та залучення громадського суспільства

Кирило Захаров
21.10.2017

Кирило Захаров - засновник проекту “Суд на долоні”, який покликаний надавати аналітику щодо судових рішень в Україні. Але в контексті цієї розмови найбільш важливим є те, що Кирило є тренером з відкритих даних, який працює в Дніпрі і є активним учасником процесу відкриття даних.

- Цього року Кирило запускав портал відкритих даних міста, і у мене у зв’язку з цим купа питань. Проте основне питання - “Що далі?”. У вас справді гарний портал і видно, що ви відпрацьовуєте процеси публікації даних та підготовки їх до публікації, але що далі? Чи у вас є якась стратегія роботи з користувачами? Outreach-стратегія - пошук користувачів, розбудови комьюніті та інше?

Зараз у нас паралельно рухаються два процеси, пов’язані з опублікованими даними на Порталі відкритих даних Дніпровської міської ради. Перше - це продовження роботи з даними, які вже опубліковані. Однією з проблем при публікації даних є проблема “брудних даних”. У них є велика кількість помилок, у значеннях даних є зайві прогалини, іноді в українських назвах компаній або підприємств можуть зустрічатися латинські літери. Зрозуміло, що продукти, які передбачають автоматичну обробку даних, не зможуть працювати точно та надавати коректні результати за наявності таких помилок. Тому один з напрямків роботи - це внесення виправлень в опубліковані масиви даних та їх покращення.

На мій погляд, таку роботу мають провадити не тільки органи місцевого самоврядування, але й центральної влади. Навіть у відносно гарних наборах даних, таких як Єдиний реєстр юридичних осіб, опублікований Міністерством юстиції, можна зустріти дані щодо підприємств, які давно не працюють, але замість відсутньої інформації використовуються некоректні записи. Наприклад, керівником такого підприємства може бути людина з ім’ям “АААААА АААААА”.

При цьому розробники, які працюють з такими даними, можуть не розуміти, як їх коректно використати. З одного боку, ми розуміємо, що такі дані не є валідними і вони ні про що не говорять. З іншого боку, це офіційний запис в існуючому державному реєстрі.

Що стосується другого напрямку, то ми дійсно зацікавлені в тому, щоб дані, опубліковані Дніпровською міською радою, не просто лежали нікому непотрібним “мертвим вантажем” в мережі інтернет, а стимулювали комьюніті розробників. Ми плануємо зустрічатися з представниками громадськості, журналістами і проводити для них майстер-класи, на яких будемо показувати, що саме можна робити з даними - від простих таблиць в Ecxel для оперативної статистики до навичок, пов’язаних з програмуванням та розробкою продуктів або прототипів, які можна розвинути до реальних продуктів.

- Ви ще проводили опитування про те, які запити є в місті на набори даних. Чи є там якісь осмислені відповіді? Є враження з цих відповідей, що якесь комьюніті існує в місті?

Я б сказав наступним чином: найбільшу користь ми отримали з безпосереднього спілкування з активістами на Facebook. З тими активістами, які й раніше стежили за діяльністю міської ради. Ми спеціально відповідно до Постанови №835 КМУ розробили форми зворотнього зв’язку для користувачів і розмістили опитування, намагаючись отримати запит на дані. Протягом двох місяців від мільйонного міста ми отримали десь 25 відповідей, з який 4 були адекватними запитами на набори даних. А інші відповіді були на рівні “Коли у нас в місті з’являться летючі автомобілі?”. Тобто вони жодним чином не мали стосунку до питань, пов’язаних з даними. Це показує, що більшість людей не має уявлення про відкриті дані і як з ними працювати.

- Тобто ваша стратегія зараз - навчати й гуртувати людей навколо цього?

Я намагаюся у цьому питанні застосовувати свій досвід. Так сталося, що я знаходжуся по обидві сторони барикад - з одного боку, я співпрацюю з Дніпровською міською радою, допомагаючи їм відкривати дані, з іншого боку, я є розробником, який з даними працює. І є кілька моментів, на які я хотів би звернути увагу та порекомендувати взяти їх на озброєння чиновникам, які працюють з даними.

Перш за все, необхідно розуміти, що є різні розробники. Є програмісти, які добре працюють з алгоритмами, і є аналітики, які добре працюють з даними. Це дуже різні спеціалісти. Далеко не завжди розробники сервісів на основі відкритих даних готові працювати саме з даними. Коли органи влади публікують “брудні дані”, які непридатні до безпосереднього використання їх в додатках, вони автоматично створюють бар’єр для використання цих даних. Іншими словами, спробуйте згадати найбільш складну у приготуванні страву, яку ви робили. Навіть, якщо ви отримали задоволення від її споживання, не факт, що ви спробуєте її приготувати знову. Це вимагає велику кількість сил та часу. Така ж ситуація і з даними. Якщо дані є “брудними”, з ними не попрацюєш.

Другий момент - це також полегшення роботи програмістів. Існуючі рішення для публікації відкритих даних, такі як CKAN, DKAN дозволяють отримувати завантажені дані через API. Таким чином, розробники можуть отримувати з порталу усі необхідні дані, з можливістю їх фільтрації засобами самого порталу. І тоді будувати свої сервіси, не використовуючи власні бази даних або інших інструментів. Наявний на порталі відкритих даних API дозволяє швидко створювати прототипи додатків.

Третє - більшість розробників звикли до стандартних інструментів і на хакатонах або аналогічних заходах використовують стандартні рішення. Наприклад, “давайте створимо мапу”, “розробимо веб-форму”, “відобразимо щось у табличках” або “впровадимо пошук”. Все. На цьому ідеї закінчуються. Вони закінчуються швидко тому, що програмісти-розробники не є спеціалістами в тих питаннях, які вирішують органи місцевого самоврядування. Отже, розпорядники даних мають самі добре знати, які послуги вони надають населенню, і, зважаючи на це, пропонувати свої ідеї розробникам, як покращити ці сервіси. Щоб це була не чергова мапа без жодної користі, а дійсно сервіс, який міська рада не може створити сама або придбати в рамках свого бюджету, але готова працювати з активістами, які можуть такий сервіс розробити.

Останнє - відкриті дані для органів місцевого самоврядування та центральних органів влади мають бути засобом комунікації з громадою. Якість опублікованих даних - це якість роботи органу, який їх опублікував. Без якісних даних органи влади не можуть добре працювати. Це факт. Відповідно, коли громада та чиновники будуть спільно виправляти опубліковані набори - це й буде робота, яка дозволить зрозуміти існуючи проблеми (наприклад, з інфраструктурою даних або відсутністю даних взагалі) та їх вирішувати. Від цього буде вигравати усе суспільство.

- Зафіксуємо, для використання даних розпорядник має забезпечити якість даних, зручність їх використання і він має сам підкидати ідеї розробникам. Тут я хотів би згадати, що Кирило нещодавно сам розробив невеликий проект на основі відкритих даних про спортивні заклади Дніпра, який покликаний показати, що якийсь веб-застосунок можна зробити доволі швидко і він буде в простому вигляді надавати корисну інформацію користувачам.

Ще одне питання. Запропонуйте три простих методи, які допоможуть розпорядникам залучати користувачів до опублікованих даних?

Дуже прості рекомендації. По-перше, органи місцевого самоврядування та чиновники завжди отримують запити і відповідно до Закону України “Про доступ до публічної інформації” відповідь на них може надаватися у формі відкритих даних. Будь ласка, не нехтуйте цією можливістю. Якщо до вас надійшов запит, дайте відповідь у формі відкритих даних і люди зможуть вже не звертатися до вас повторно, бо цю відповідь вони вже зможуть знайти самостійно. Ви одразу полегшите життя усім. Подивіться запити, які надходили раніше - це також джерело для розуміння запиту громади.

По-друге, є сенс передивитися архіви новин і подивитися у місті на будь-яку активність. Усі активісти, які розробляли аналітичні матеріали - це люди, які працювали з даними. Якщо раніше їм ці дані необхідно було отримувати через безліч запитів, то тепер ви можете самостійно піти до них назустріч та налагодити співпрацю.

Окрім цього, працюючи на тренінгах з чиновниками, я їм кажу, що перед публікацією набору, необхідно довести дані до такого стану, коли ви самі б хотіли ними користуватися. Наприклад, перед вами стоїть завдання знайти середнє, суму або ще якимось чином обробити дані - вони мають бути для цього придатні.

І цю тезу я готовий продовжити. Якщо ви є чиновником, який розуміє що він надає дуже корисну послугу і що на даних, які ви маєте, можна розробити приголомшливий сервіс, який можна продавати за великі гроші, то оформлюйте підприємство на родичів, залучайте комьюніті, яке може розробити продукт, та впроваджуйте! Це результат, який ви отримаєте тут і зараз! В інших випадках питання стимуляції громадського запиту на відкриті дані - це питання не тільки чиновників, а й питання комьюніті відкритих даних. Це громадське суспільство вимагало публікації даних, тепер питання цього ж громадського суспільства стимулювати інтерес до опублікованих даних.

Модератор дискусії Андрій Газін