Антикорупційні відкриті дані України: куди нам рухатись

8 грудня 2017, 16:21
9 грудня – Міжнародний день боротьби з корупцією

2014 року Anti-Corruption Working Group великої двадцятки визначила, що відкриті данні можуть допомогти виявити, розслідувати та зменшити корупційні зловживання.

Це є головною причиною, чому країни по всьому світі відкривають дані.

Відео дня

Україна не відстає від світових тенденцій. Починаючи з 2015 року, уряд щорічно збільшує публікацію відкритих даних. У 2016-му наша країна піднялася в міжнародному рейтингу Open Data Barometer з 62 до 44 місця. Міжнародні експерти високо оцінюють запровадження відкриття даних з публічних закупівель за допомогою ProZorro, реєстру бенефіціарних власників Міністерства Юстиції та інших.

З упевненістю можна сказати, що це визнання є заслуженим, адже у сфері публічних закупівель ми є одними зі світових лідерів.

Але куди рухатись далі, аби прогрес не уповільнювався? Які дані потрібно відкрити, щоб мати максимальний антикорупційний ефект? Для комплексного підходу до відкриття антикорупційних даних та їх аналізу варто користуватися міжнародними інструментами, такими як The Anti-Corruption Open Data Package та G20 Anti-corruption Open Data Principles.

Завдяки цим інструментам, а також відкриттю наборів даних (електронні документи, які містять відкриті дані та складаються із структурованих однорідних значень/записів) та за правильних умов, можна створити потужну антикорупційну інфраструктуру даних.

Більшість антикорупційних наборів в Україні вже доступна в тому чи іншому вигляді. Наші сусіди та багато західних країн не можуть продемонструвати такого результату. Втім, як показує досвід нашої держави, розкриття даних не є панацеєю для зменшення корупції. Відкриті дані можуть відігравати важливу роль у протидії корупційних злочинів тільки тоді, коли уряд забезпечує взаємодію цих відкритих даних. Саме тоді опубліковані набори дозволяють створювати інструменти для здійснення антикорупційного розслідування.

В Україні вже знають такі інструменти, як OpenDataBot та YouControl, 007, Золото партій та інші. Але створення таких інструментів для ефективного використання антикорупційних наборів даних, залежить великою мірою від двох важливих складових. Перша – це якість даних, оскільки неякісні дані потребують значно більших зусиль на обробку. Саме доступність у машиночитаному форматі та повнота даних дозволяють швидкий та ефективний аналіз.

Критерії, які є важливими для оцінки якості даних:

  • Машиночитаність – дані доступні в форматі, придатному для автоматичної обробки комп'ютером.
  • Повнота даних – всі доступні для ручної роботи дані є також і в машиночитаному форматі, а самі дані не містять значних пропусків (наприклад, на порталі Є-Data досі не зареєструвалася третина розпорядників публічних коштів).
  • Пояснення – має міститися інформація про значення полів, кількість доступних запитів за API та інші особливості роботи з даними.
  • Цілісність – усі дані можна завантажити єдиним архівом, а не збирати по частинках.
  • Унікальний ідентифікатор – дозволяє розрізнити об'єкти з однаковою назвою чи повним ім'ям.

Друга складова – це наявність навичок аналізу даних. Це насамперед люди з базовими навичками програмування. Такі навички дають можливість робити якісний моніторинг даних та створювати інструменти на їх основі. Більшість активістів можуть знайти інформацію про ту чи іншу людину або організацію, але проаналізувати та виявити тренди – це наступний рубіж, який для багатьох поки що недосяжний. Можна знайти тренінги, де цього вчать. Але таких ініціатив ще замало для системного, якісного підвищення data literacy (грамотності в роботі з даними).

Зараз державні органи повинні не лише опублікувати ті дані, яких не вистачає. Вони повинні покращити якість вже наявних наборів даних. Але важливо розуміти, що відкриття та покращення якості даних – це не суто технічний процес, який відбувається в ізоляції. В його центрі має бути користувач, а сам процес має бути двостороннім, тобто бути діалогом. Регулярне залучення користувачів, консультації з ними – це не забаганка, а саме механізм того, як переконатись, що опубліковані дані були корисними.

Що ж мають робити користувачі? По-перше, підвищувати свою грамотність у роботі з даними. Організації, які володіють навичками обробки та аналізу даних, мають ділитися знаннями та поширювати їх. По-друге, користувачі повинні проводити кампанії з розкриття решти наборів даних. Сприяти створенню тих чи інших реєстрів з The Anti-Corruption Open Data Package, щоб інфраструктура відкритих даних була динамічною та ефективною.

Показати ще новини
Радіо НВ
X