Declarator research

Page 1


Особенности и варианты развития проекта declarator.org: мнения пользователей рядового и экспертного уровня. Аналитический отчет по результатам исследования / Рудь Д. С. — М., 2018. — 42 с.

___ © Рудь Дарья Сергеевна © Центр антикоррупционных исследований и инициатив «Трансперенси Интернешл - Р»



В мае-июне 2018 г. проводился добровольный опрос посетителей сайта (71 респондент ), а также четыре глубинных полуструктурированных интервью с информантами, предоставленными Заказчиком: сотрудником TI, пользователями (журналист-расследователь и журналист-обозреватель) и потенциальными пользователями (научные сотрудники). 1

Среди респондентов опроса 54% (38 человек) посещают declarator.org впервые. Более трети опрошенных (26 человек) указали, что посещение связано с их работой. Среди посещающих сайт впервые таких 12 человек (для 5 посещение в первую очередь обусловлено работой, для остальных 7 – имеет некоторое отношение к работе). Среди посещающих сайт не впервые пришедших по работе пользователей 14 (у 7 человек посещение в первую очередь обусловлено работой, еще у 7 – имеет некоторое отношение к работе). 2

Цель исследования – сбор информации, необходимой для принятия решения о направлениях развития проекта declarator.org. Опрос и интервью были направлены на проверку некоторых гипотез, предоставленных Заказчиком, а также на сбор сопутствующей информации. Гипотезы: 1.

2.

3.

Пользователи целевой аудитории не знакомы с существенной частью имеющегося функционала ресурса (не понимают порядок получения доступа к исходным файлам, не понимают разницу между расшифрованными (переработанными в машиночитаемый вид) и нерасшифрованными данными, не осознают масштаб количества должностных лиц, информацию о которых можно получить на сайте); Опция по построению социального графа должностных лиц на основе используемых данных или дополнительных источников (в том числе созданных самими пользователями) является востребованным направлением развития проекта; Другие востребованные направления развития могут включать интеграцию со статисти-

ческими инструментами, настройку API, составление индексов регионального характера и др. Были поставлены исследовательские вопросы: 1. Каковы цели посетителей сайта, каким образом можно их типологизировать? 2. Какие потребности пользователей удовлетворены на настоящий момент, какие остаются неудовлетворенными? 3. Какие проблемы и недочеты выделяют пользователи? 4. Дополнительно был введен блок, касающийся перспектив сбора денежных средств на проект. В блок вошли вопросы об опыте финансовой поддержки интернет-проектов в целом (для респондентов онлайн-опроса), оценка перспектив фандрайзинга.

Цель проведения онлайн-опроса – охват пользователей различной степени знакомства с declarator.org. Вопросы в сценарии индивидуального интервью и в анкете для онлайн-опроса схожи; при этом предполагается, что спектр задач, с которыми пришли «случайные» пользователи-респонденты онлайнопроса, шире. Таким образом, онлайн-опрос помогает собрать информацию о моделях использования сайта более разнообразной, не обязательно профессиональной аудитории.

Цель проведения интервью – уточнение моделей использования сайта пользователями экспертного уровня, выяснение мнений о возможностях развития проекта.

Цели посещения можно разделить на следующие группы, граница между которыми нечеткая: 1.

Знакомство с «общей картиной» с позиции скорее не владеющего навыками анализа данных посетителя. В данном случае пользователя можно сравнить с фланёром, «гуляющим» по данным деклараций. К посетителям с ознакомительными целями можно отнести чуть более половины респондентов массового опроса – 35 человек.


Примеры ознакомительных целей:  для самообразования  Меня забавляет смотреть на зар-

   

платы чиновников и сравнивать их с зарплатой и пенсией своих родителей бюджетников в регионе. Учителей, служащих, врачей Узнать, правда ли богатые люди декларируют открыто свои доходы? Интересно, кто сколько зарабатывает из чиновников Любопытство/ просто интересуюсь/ с ознакомительной [целью] Желание ознакомится с декларациями разных людей и понимать, что к чему пришел с чата https://t.me/begtinchat @xodapi. Интересуюсь данной темой в качестве пользователя, чтобы понять происходящие процессы в окружающей действительности, удобно было бы в одном месте увидеть все декларации и аналитику по ним

[респонденты массового опроса]

[респонденты массового опроса] 

Инструментальное использование основного интерфейса, без работы с массивами данных. Пользователи приходят с конкретной целью и могут использовать declarator.org наряду с другими ресурсами для достижения этой цели. В эту группу можно отнести всех посетителей, использующих сайт по работе (респонденты ответили утвердительно на вопрос, связано ли посещение с их работой; а также, безусловно, всех информантов интервью). Цель таких посетителей — прицельный поиск деклараций по персонам или органам (расследования или сбор информации об узкой группе лиц), использование сайта в качестве справочника:  Узнать доходы "московских" чинов 

ников в Ярославской области юридическая деятельность, частное расследование Собираю информацию для дипломной работы о партийной принадлежности и семье

Для чего я очень часто использую declarator – это поиск PEPов [politically exposed person] так называемых, потому что часто бывает, что у меня много разных имен, которые делали что-то, которые по каким-то причинам мне в моей работе интересны. И мне нужно понять, этот человек – он вообще politically exposed, то есть он как-то связан с политикой? И очень удобно просто забивать фамилию. Да, я начинаю даже с фамилии, чтобы весь спектр родственников его мог попасть в поле моего зрения. И смотрю. 3

[журналист-расследователь] А также с определенной целью могут прийти и те, чье посещение с работой не связано (ответившие на вопрос о связи их посещения с работой отрицательно):  

В этом случае пользователи во многом ориентируются на то, что предлагает им сайт, и реже сталкиваются с проблемами при его использовании. 2.

Хотим сделать видео про доходы местных чиновников

 

Узнать доход близкого человека Посмотреть, сколько жена зарабатывает Посмотреть имущество Воробьев Андрей Юрьевич, виновника экологической катастрофы на полигонах ищу место работы Кокошина Д.Н. Проверить информацию из какогото видоса

[респонденты массового опроса] Всего к респондентам с инструментальными целями можно отнести более трети участников массового опроса – 28 человек. 3.

Работа с массивами данных. Среди участвовавших в онлайн-опросе лишь один пользователь указал соответствующую цель (data mining). В интервью с научными сотрудниками, привлеченными к исследованию специально в качестве экспертов по работе с массивами данных, был подтвержден значительный потенциал такой работы – интеграция с другими массивами, проверка моделей выявления недобросовестного поведения, эвристический анализ в целях поиска таких моделей и т.п.


Рассмотрим подробнее проблемы и требования пользователей, типологизируя их в соответствии с возможными решениями и направлениями развития:

Из респондентов онлайн-анкетирования 28 человек отметили, что столкнулись с проблемами и недочетами при использовании сайта. Среди пришедших на declarator.org впервые проблема появилась у трети, а среди посещавших сайт и ранее половина отметила, что столкнулись с проблемой в данное или другое посещение. Чуть выше доля столкнувшихся с проблемами среди тех, кто посещает сайт по работе, а также среди тех, кто осуществляет прицельный поиск должностного лица (лиц). Что касается требований к функционалу declarator.org, то информантам в интервью, как правило, было нелегко сформулировать пожелания к новым возможностям сайта; а сформулированные желания часто представлялись недостаточно значимыми для внедрения:

какие-то минимальные пояснения, в принципе, могли бы быть полезны. Но, с другой стороны, почему вы должны разжевывать всё до такой степени, если это всё можно собрать по открытым источникам? [журналист-расследователь] Для массового опроса был предложен список вариантов ответа, выбором из которого большинство респондентов и ограничилось, не предлагая своих вариантов. Наиболее популярным стали такие ответы как «визуализация семейных связей между субъектами декларирования» (43 человека), «идентификация подозрительных деклараций» (38 человек), «карьерные траектории субъектов декларирования» (36 человек), «фотографии подотчетных лиц» (33 человека) и «агрегированные данные по семьям субъектов декларирования» (31 человек).

Да, да. Я так и подозревала. Я, что называется, пробовала работать с госорганами, и там даже не всегда реально получить, сколько людей работает. [научный сотрудник]

Большая часть проблем, вопросов и пожеланий, возникающих у пользователей, связана с недостаточной информированностью о способах формирования и предоставления данных. Чаще всего встречающейся проблемой в массовом опросе (для 19 человек) оказалась невозможность найти интересующие данные. Причем нельзя сказать, что эти респонденты ошибочно сочли интересующее их лицо субъектом декларирования – в целях визита указано «Посмотреть декларации депутатов ГД», «Найти де-

кларации работников органа местного самоуправления» и т.п. Можно выделить следующие блоки: 1.

Учитывая частоту встречаемости проблемы отсутствия данных, вероятно, будет актуально использовать заметный информационный блок (например, демонстрируемый в случае безрезультатного поиска) со стандартными возможными причинами отсутствия данных, описанием процесса и сроков добавления деклараций на сайт, предпринимаемыми командой проекта действия в связи с отсутствием данных. 

[журналист-расследователь] Подобный информационный блок может играть роль в снижении негативного впечатления у «рядовых» пользователей, не нашедших что-либо. Он также будет встречен с пониманием у специалистов по работе с данными, предоставляемыми о гос. служащих: 

Объяснения, почему данные могут (временно) не быть принятыми в проект, также могут найти отклик у пользователей: 

Отправлял на сайт декларации с указанием официального сайта-источника, но они не были размещены [респондент массового опроса]

2.

Может быть востребованным описание имеющихся в проекте данных.

насколько я понимаю, вы сначала выгружаете самых главных, потом чуть менее главных. И вот мне кажется, с какими-то районными историями у меня что-то не находилось.

Интересует в принципе размер базы (…). Верно ли, что все сдают декларации, кто должен был сдавать? Интересно в годовом разрезе (сколько должно было сдавать, сколько сдало), какой размер покрытия относительно регионов и организаций. [научный сотрудник] …информация о том, сколько губернаторов сдали декларации [респондент массового опроса]

Стоит указывать, что декларированный доход за год: некоторые региональные чиновники в примечаниях к


декларации указывают среднемесячный доход [респондент массо-

недоресёчила закон. Потом я поняла, что действительно, когда ты избираешься в 11-м году, ты должен предоставить сведения о доходах за 10-й год. [журналист-

вого опроса] Также вариантом описания могут стать пометки, сигнализирующие, полностью ли укомплектованы данные в разделе (органа, региона и т.п.), тем более что такая возможность существует:

мы можем отслеживать, что есть некие органы, в которых, мы точно знаем, что все данные распарсены или вручную перенесены [сотрудник declarator.org]

3.

Актуальна заметная просветительская информация о природе данных - органах и актах, регулирующих открытую публикацию деклараций и их контент; возможно, опыт других государств в данном вопросе в сравнении с РФ. Часть посетителей сайта могут ошибочно полагать, что таким регулятором является declarator.org, и, соответственно, возлагать на проект напрасные ожидания: 

Добавьте в декларации более мелкое имущество, такое как часы, хотя бы у самых высоких слоев власти, как например депутаты. Хотелось бы чтобы на сайте были декларации людей, не являющихся резидентам РФ, но имеющее отношение через бизнес, недвижимость и т.п. Например, Усманов А.Б. Желаю, чтобы не чиновники сами публиковали данных о доходах, а это делали банки в автоматическом порядке. Если чиновник держит счета в банке, то банк обязан автоматически опубликовать их на деклараторе. Аналогично должны поступать организации, имеющие все сведения о недвижимости и ином имуществе данных лиц. [респонденты массового опроса]

Вероятно, со стороны declarator.org и TI возможна также работа по аккумулированию и анализу подобных предложений, адресованных к системе отчетности. Для пользователей экспертного уровня актуально сверяться с правилами, регулирующими подачу деклараций: 

у меня был один конкретный случай, когда я сделала ошибку в материале, и это могло бы быть решено с помощью каких-то обучающих материалов. (…) я не могла понять, в чем дело, немножко не досмотрела,

расследователь]

Как было указано выше, отсутствие данных – довольно часто встречающаяся проблема. Помимо создания информационного блока с описанием возможных причин отсутствия, вариант работы с данной проблемой – предоставить возможность обратной связи «on the spot», особенно в том случае, если пользователь является экспертом или в данных содержится явная ошибка (например, «некоторые данные уже опубликованы, но у вас не представлены» «была ошибка в доходе Сулеймана Керимова за 2016 год» [респондент массового опроса]).

Может быть, добавить какую-то кнопку для пользователей, что «я не нашел этого чиновника», чтобы приходило уведомление, что нужно, чтобы чья-то декларация была расшифрована. Какой-то такой звоночек, маячок, что этим чиновником интересуются и можно добавить. [сотрудник TI]

Для всех групп пользователей актуально повышение удобства понимания данных – это может быть как аналитика (результаты расчетов), так и просто более четкое донесение смысла показателей.

Непонятно, что я должен уяснить, просматривая декларации, кроме того, как много они зарабатывают [респондент массового опроса]

По данным исследования можно выделить несколько типов таких «мостиков» к четкому пониманию данных: рейтинги, индексы и средние значения, сигналы («красные флаги») о возможной недобросовестности, визуализация отдельных показателей, обозначение семейных связей. Рассмотрим эти формы подробнее:

Рейтинги, ранжирование, обозначение первых и последних – наиболее востребованная форма предоставления данных:

Когда скачиваешь декларацию с сайта Госдумы, там же они просто в алфавитном порядке, а ранжировать по доходам


– это тоже очень полезно бывает [жур-

 

налист-расследователь]

Самый бедный, самый богатый чиновник органов власти. Брать какое-нибудь Законодательное собрание, и чтобы он там показывал. (…) Обычно в рейтингах у журналистов бывает. В основном, богатые жены [сотрудник TI] рейтинг доходов чиновников по регионам, такой же как на главной странице

зреватель]

[респондент массового опроса]

нет никаких рейтингов коррупции по регионам. И нам они нужны. Самый простой индикатор – разброс доходов чиновников в регионе [научный сотрудник] Если была бы возможность сравнивать, кто самый богатый (допустим, депутаты выложили свои декларации), была бы возможность ранжировать их по объёму денег (площадь там не ранжируешь никак, так как там сложные алгоритмы), то я, наверное, пользовалась бы, но я просто не видела такого. [журналист-обозреватель]

Актуальны средние показатели по разделам:

если мы знаем, кто является закупщиком, заказчиком, мы можем посмотреть, что творится с декларациями по этому ведомству, хотя бы средний доход, и мы можем посмотреть на задекларированный средний доход разных заказчиков и прилинковать к коррупции в госзакупках

[научный сотрудник] а также по субъектам декларирования в базе в целом (что, например, способствует достижению такой цели как «уточнение уровня средних зарплат»).

Наиболее простой для команды проекта дополнительной услугой может стать визуализация уже переведенных в машиночитаемый вид данных. Такая функция востребована пользователями, особенно привыкшими к эффектному знакомству с данными посредством дизайна:

больше визуализации, картинок. Цифры не стоит прописывать полностью, теряется их сила, лучше использовать сокращения миллион, миллиард и т.д. [респондент онлайнопроса]

Для некоторых пользователей может быть полезным видеть в такой же форме, как графики по доходу/площади недвижимости/транспортным средствам, также и другую информацию об имуществе – например, как давно один и тот же объект находится в собственности:

Перспективным может быть и обозначение нестандартных отклонений, изменений, всплесков и выбросов – по сравнению с коллегами или с самим субъектом декларирования в прошлых периодах:

Автоматически показывать чиновников, у которых изменилось благосостояние, то есть они продали или купили что-нибудь. Странные отклонения в доходе, то есть зарабатывал человек по миллиону, а тут раз – и 10 миллионов заработал. Такие вещи тоже можно как-то сделать в автоматическом режиме, я думаю. [сотрудник TI]

Можете посчитать, сколько лет она во владении, потому что её декларируют годами. [журналист-обозреватель]

Причем некоторые пользователи выражают желание видеть гибрид из готовой аналитики и «сырой» базы – им нужна система, которая позволяла бы неспециалисту самостоятельно заниматься выявлением и анализом связей, компоновкой различных данных, построением интерактивных графиков:

если появляются какие-то интересные цифры, то можно покопать, – в прошлом году Памфилова очень много заработала, какие-то такие вещи. Ещё иногда разводы, заграничная недвижимость. Неровности и расхождения – была квартира в Испании и исчезла; было три, а стало пять. [журналист-обо-

Была бы интересна система, которая позволяла бы анализировать информацию, сравнивать связи, вытаскивать какие-то аномалии. Сильные колебания у товарища были: было по 5 миллионов дохода, а потом – 90; вот и можно узнавать, с какого перепуга, не лазить самой, не сравнивать. Вот это могло бы быть интересно. [журналист-обозреватель]

Обозначение семейных связей и их динамики востребовано как у аудитории массового опроса (первый по популярности ответ на вопрос о дополнительных возможностях), так и информантов глубинного интервью (упомянуто в 3 интервью):


вот еще вспомнила, зачем я захожу: помимо того, чтобы узнать доход или какая недвижимость есть у человека, еще, например, это хорошо, когда мне нужно узнать, есть ли у человека жена, например, или нет. Где это можно посмотреть? Это можно посмотреть в декларации. Ну, и в плане разводов тоже отслеживается хорошо: жена пропала – значит, развелись. То есть вот если говорить про выгрузку политиков, то, если можно было бы еще автоматически там же подгружать типа «женат, двое детей несовершеннолетних», – вот это тоже было бы суперполезно, чтобы потом вместе выгружалось. [журналист-расследователь] есть какие-то вещи, которые хотелось бы там сделать. Я не знаю, поиск мужа, жены… [сотрудник TI]

Востребована как визуализация связей между супругами-субъектами декларирования, так и работа по анализу супружеских связей и распределения имущества в семье с привлечением сторонних баз:

В нашей базе тогда можно проверить. Если ректор, то жена ректора – тот же самый адрес, имеет тоже машину… [научный сотруд-

Однако в данном вопросе профессиональные расследователи могут иметь иное мнение:

Есть также и программная проблема с отображением декларации родственника, если е него (нее) отсутствует имущество:

Сейчас, вообще, в принципе, невозможно добавить на декларацию какого-то супруга или супругу, если у них нет ни дохода, ни недвижимости, ни машин, то есть их вообще нет в базе. Это, кстати, такой очень неприятный баг, потому что они вообще из статистики выпадают. [сотрудник TI]

Может быть актуальным акцентирование внимание на данных, актуальных в связи с последними политическими событиями, или недавно добавленных данных:

Декларации все, я бы сказала, 90 % подозрительные. [журналист-расследователь]

Представители научной лаборатории в первую очередь заинтересованы в использовании данных declarator.org в связке с собственными базами. Результатом работы аналитиков с базой могут быть научные статьи, а также – что можно непосредственно использовать работе в declarator.org – список показателей, потенциально указывающих на недобросовестность агента:

ник]

Какие-то маркеры да, могут быть. Например, самое простое, если чиновник бомж. Нет никакой недвижимости. Понятно, что это недостоверные сведения, и тут надо сразу высвечивать такие декларации и делать какие-то юридические вещи. Если чиновник или жена чиновника бомж, или ребенок бомж. [сотрудник TI]

мы стараемся вытащить обычно все, что только можно, а потом уже что-то идет в статьи, а что-то не идет, но для нас это контрольные переменные в регрессиях. Когда мы строим регрессии, мы пытаемся максимально очистить и зафиксировать, чтобы показать, что вот он, есть чистый эффект влияния. [научный сотрудник]

В интервью обсуждалось, в основном, слияние с базой госзакупок («склейку» можно произвести по названию организации/ИНН), а также, например, с базой ГИБДД («склейка» по ФИО должностного лица). Результатом статистического анализа такой совокупной базы является не расследование, раскрывающее факты о конкретных лицах, а напротив, доказательство существования общего индикатора, указывающего на факт коррупции:

Например, мы пробивали новых министров.

у нас нет задачи сказать, что этот чиновник коррупционный. Нам, наоборот, не рекомендуется спускаться на личности. Indicative evidence. Про личности ничего не говорим.

[журналист-обозреватель]

[научный сотрудник] Были предложены идеи совмещения базы declarator.org и с другими массивами в целях выявления недобросовестного поведения – например, содержащими наукометрические показатели по вузам:

Идентификация подозрительных деклараций – второй по популярности ответ о желательных новых возможностях сайта среди респондентов массового опроса.

команда Стерлигова смотрит на индексы цитирования, на публикации по вузам. Интересно смотреть, как декларации связаны с количеством публикаций, которое вузы продуцируют. Потому что про некоторые вузы 4


известно, что для них нормально покупать публикации, чтобы повысить свои показатели [научный сотрудник] Развитие аналитических идей связано с наличием более-менее постоянного состава «научных руководителей» и «рабочих рук» для интеграции баз и выполнения расчетов. Трудоемкость такого процесса оправдана возможностью получения уникальных результатов на выходе:

Если вы готовы впустить очередного студента, я какую-нибудь такую тему попробую заявить. Создать межрегиональную картинку показателей, чтобы попытаться сравнивать регионы между собой. Есть много теорий - теория по паблик-сектору, агентская теория относительно того, как смотрится размер зарплаты, сравнивается с аутпутом. И можно воплотить идеи, связанные с тем, чтобы посмотреть, какие доходы, например, у губернаторов, у верхушки региона, и как это коррелирует с экономическим развитием региона. В принципе, этого еще никто не делал, и это один из возможных вариантов [научный сотрудник]

Желание использовать массивы данных declarator.org и сопоставлять их с другими может возникать и у пользователей, не владеющих навыками соответствующего анализа. Так, например, для журналистарасследователя может быть удобно использовать полную базу субъектов декларирования для сравнения ФИО с другими находящимися в их распоряжении данными:

может быть, стоит экстрактировать, чтобы это был действительно список PEPов. Потому что для каких-то целей мне удобно зайти и смотреть, но бывают же еще разные cross-search’и, например, когда полезно было бы, чтобы у меня был, я не знаю… Excel-файл со списком чуваков, которые занимали должности и отчитывались о доходах, и я могла сравнить его со списком людей, которые имеют недвижимость в конкретной стране. [журналист-расследователь]

При этом самостоятельная работа с базой журналистом без соответствующих навыков невозможна, необходимо дополнительное звено в виде «технического специалиста»:

…я говорила об этом с нашими ребятамитехниками, и, насколько я понимаю, теперь у вас появилось API, и это должно быть вообще очень легко. Но я не знаю, как он работает, поэтому я закидываю эту идею своим ребятам-коллегам. [журналистрасследователь]

У нас есть люди, которые умеют составить таблицу, быстренько посчитать, кто богаче всех. Не то чтобы я сама это могла сделать – просто есть люди, которые это умеют делать. [журналист-обозреватель]

Со стороны информантов из журналистики поступил запрос на дополнение данных: размещать не только ссылку, по которой доступен оригинал декларации (на сайте соответствующего органа), но и сам документ-оригинал. Причина такого пожелания – необходимость быстрой сверки документа. В этом случае не нужно сверять каждую цифру, но достаточно визуально сверить идентичность или просто использовать декларацию в первоначальном виде в качестве «доказательства».

А нельзя ли сохранять сами декларации, чтобы они тоже хранились, чтобы я могла у вас же скачать тот документ, который я могу найти потом на официальных сайтах? [журналист-расследователь]

Однако не обсуждается обратная стороны такого решения – излишняя нагрузка на сервер. В то же время, для некоторых пользователей и сама ссылка на первоисточник может казаться незаметной:

я не помню, честно говоря, чтобы были ссылки, которые были бы под рукой, чтобы ткнуть и перейти. Это был бы идеальный вариант. [журналист-обозреватель]

Деятельность расследователя связана с поиском дополняющих декларацию данных, и закрытый раздел сайта мог бы стать своеобразной записной книжкой для хранения найденных в других источниках фактов:

есть какие-то вещи, которые хотелось бы там сделать. (…) возможность добавлять куда-нибудь в секретный раздел адреса найденных объектов. (…) Для внутреннего пользования. Понятно, что это персональные данные. [сотрудник TI]

Такой раздел может быть полезен и научным сотрудникам для сохранения статей по темам или органам власти, и другим пользователям, ведущим системную деятельность на сайте.

Существует и противоположная закрытому разделу потребность – в возможности комфортно и красиво


опубликовать найденные на declarator.org интересные факты, например, в социальных сетях:

[Нужна] возможность декларации в соцсетях как-то шарить красиво, чтобы какая-то форма в Facebook, в Twitter, ВКонтакте добавлялась. Чтобы это опубликовалось в виде какой-нибудь красивой таблички. [сотрудник TI]

Такой путь расширения ареала «охвата» актуален, поскольку журналисты, хотя и используют declarator.org в работе, не ссылаются на него:

«Декларатор» для нас – ненадлежащий источник, потому что он фактически копирует информацию, а мы не можем отвечать за то, насколько точно он её копирует. «Декларатор» может служить только для ориентира, потому что потом всё равно приходится это подтверждать – какие-то адекватные источники. [журналист-обозреватель]

Указать declarator.org в качестве источника данных для журналиста возможно лишь в крайнем случае:

В принципе, может так получиться, что нет этой информации на сайте, её там, допустим, затёрли, а в «Деклараторе» есть, тогда, наверное, я укажу источником «Декларатор», уточнив, что на официальном сайте информация отсутствует. [журналист-обозреватель]

На данный момент declarator.org скорее не имеет образа источника, на который легко сослаться:

Насколько я понимаю, на declarator еще сложно дать ссылку, потому что, скорее всего… Я точно не помню, как это сейчас работает, но, по-моему, … У меня есть ощущение, то если ты даешь URL, то ты попадаешь просто на главную страницу declarator. [журналист-расследователь]


положить, что в группе использующих сайт в профессии доля тех, кто готов поддержать, выше среднего. Этот тезис подтверждается и в интервью с сотрудником TI:

 Респонденты онлайн-опроса отвечали на вопрос о своем опыте финансовой поддержки Интернет-проектов. Треть из них (24 человека) имеют такой опыт, остальные не финансировали интернет-проекты никогда. Среди проектов, которым они оказали поддержку, респонденты указывают организации, противостоящие коррупции и закрытости информации (ФБК, OCCRP, clearspending); СМИ и youtube-каналы («Дождь», blackserjprodaction); либо в ответе фигурирует платформа для фандрайзинга в целом (patreon, change.org), также указаны другие варианты (Mozilla

Foundation, Навальный, стартапы, благотворительные организации, нейроинтерфейс). 17 человек ответили на вопрос о примерном размере поддержки, которую они оказали. Для 10 человек она находится в пределах 1500 руб., для 6 – от 3000 до 15000 руб.

В первую очередь это люди, которые заходят на «Декларатор», чтобы что-то посмотреть интересное. Журналисты тоже; такие люди, которые готовы добавить каких-то денег за то, чтобы им было удобно работать с данными. Должна быть понятна причина: «Вот смотрите, какой крутой сервис. Мы над ним должны работать. Дайте нам денег, чтобы это работало дальше и развивалось». [сотрудник TI]

Для результативного фандрайзинга, по мнению опрошенных, необходима полноценная и систематическая работа, выделение на эту задачу человеческого ресурса:

Проблема в том, что системой надо заниматься постоянно. На это должен быть отдельный человек, который будет что-то делать, чтобы оно работало. Этим должен заниматься отдельный человек. Это должна быть отдельная система. [сотрудник TI] Это всё равно работа. [журналист-обозреватель]

Гипотетически о своей готовности финансово поддержать declarator.org сообщили 23 человека, причем у 10 из них нет опыта поддержки других интернет-проектов. В основном респонденты ответили, что пожертвуют однократно (20 человек), либо «оформят регулярное пожертвование». Ответ «перешлю предложение знакомым» выбрали 9 человек. Половина из респондентов, чье посещение в первую очередь обусловлено работой (6 из 12 таких человек) отметили, что откликнутся на предложение финансово поддержать declarator.org, т.е. можно пред-

Некоторые информанты интервью перспективным форматом фандрайзинга считают работу с фондами, а не конечным потребителем данных:

я не думаю, что пользователи будут, к сожалению, на это жертвовать особо. Но в плане того, что надо продвигать… Всякие, в том числе какие-то зарубежные фонды, которые поддерживают всякие антикоррупционные движения – тут должны быть вполне хорошие перспективы. Я бы посоветовала, так скажем, дать на это денег, если бы меня спросили. [журналист-расследователь]


Основные результаты исследования представлены в тексте выше. В данном разделе обозначим результаты проверки гипотез.

Пользователи целевой аудитории не знакомы с существенной частью имеющегося функционала ресурса (не понимают порядок получения доступа к исходным файлам, не понимают разницу между расшифрованными (переработанными в машиночитаемый вид) и нерасшифрованными данными, не осознают масштаб количества должностных лиц, информацию о которых можно получить на сайте);

У пользователей-журналистов может не быть необходимости знакомства с полным функционалом, поскольку их работа ведется в связке с техническими специалистами или информационным отделом. Для научных сотрудников также характерно разделение труда на работу с данными и миграцию базы (последнее выполняет технический специалист). Масштаб и охват должностных лиц, чьи декларации представлены на сайте, действительно, остается не совсем ясным для большинства пользователей.

Опция по построению социального графа должностных лиц на основе используемых данных или дополнительных источников (в том числе созданных самими пользователями) является востребованным направлением развития проекта;

Социальные, в первую очередь семейные отношения субъектов декларирования, интересуют пользователей всех категорий. Возможность совмещать декларации с дополнительными данными актуальна, особенно для журналистов и других, располагающих данными прошлых расследований, научными статьями по теме или подобными дополнительными данными.

Другие востребованные направления развития могут включать интеграцию со статистическими инструментами, настройку API, составление индексов регионального характера и др.

По результатам данного исследования, использование API и интеграцию со статистическими инструментами нельзя назвать особенно востребованными, однако, вероятнее всего, это объясняется смещением выборки в сторону от data-специалистов. В основном, опрошенные пользователи не владеют навыками анализа массива данных. Пользователи-специалисты могут использовать возможность связаться с разработчиками напрямую. Индексы и средние показатели – по региону, месту работы и т.п. – наоборот, весьма востребованы большинством пользователей.


— Скажите, когда вы последний раз заходили на declarator.org?

— Ну, наверное, недели 3 назад я была, может, чуть меньше.

— Что делали в это время? — Я искала конкретную декларацию конкретного человека за конкретный год.

— Нашли удачно? — Да. — А вообще, в каких случаях вы обычно обращаетесь к площадке declarator?

— Прежде всего, когда мне нужны конкретные декларации конкретного человека, потому что я знаю, что там они в одном месте хранятся, и их легко найти. Вместо того чтобы идти на сайт ведомства – и долго, и сложно искать. Это первое. А второе, на самом деле, для чего я очень часто использую declarator – это поиск… Ну, как сказать… Поиск PEPов (politically exposed person) так называемых, потому что часто бывает, что для работы с какими-то данными у меня много разных имен разных людей, которые делали что-то, которые по каким-то причинам мне в моей работе интересны. И мне нужно, прежде всего, – что я обычно делаю по работе, когда сталкиваюсь с этим именем, – мне нужно понять, этот человек – он вообще politically exposed, то есть он как-то связан с политикой? И очень удобно просто забивать фамилию. Да, я начинаю даже с фамилии, чтобы весь спектр родственников его мог попасть в поле моего зрения. И смотрю. То есть очень хороший список PEPов, на самом деле, который как раз мне, да - если говорить про идеи, для чего можно декларации использовать, это, прежде всего, в общем, готовый, в каком-то смысле – он неполный, конечно – список российских PEPов, и он протяженный во времени. Потому что одно дело – список современного правительства, а другое дело – когда в одном месте собраны, по сути, все имена, я не знаю, с какого… Ну, с 10-го года, с 9-го.

— За всю историю. — Вот. В общем, это довольно полезная штука. — То есть так вы и используете как раз площадку, да?

— Да, я так использую. Но я еще думаю про то, что, в принципе… Я не знаю, в каком у вас это виде

там хранится, но для каких-то целей было бы полезно, чтобы я не заходила на declarator и вбивала фамилию – ну, это тоже полезно. А второе – это, может быть, стоит сделать… То есть экстрактировать уже, чтобы это был действительно список пепов. Потому что для каких-то целей мне удобно зайти и смотреть, но бывают же еще разные cross-search’и, например, когда полезно было бы, чтобы у меня был, я не знаю… Excel-файл со списком чуваков, которые занимали должности и отчитывались о доходах, и я могла сравнить его со списком людей, которые имеют недвижимость в конкретной стране.

— А вы такой еxcel-файл себе сами не делали? Вы не выгружали данные?

— Пока не выгружали. Но вот я насколько понимаю… То есть я вообще человек не очень технически подкованный, но я говорила об этом с нашими ребятами-техниками, и, насколько я понимаю, теперь у вас появилось API, и это должно сделать вообще очень легко. Но я не знаю, как он работает, поэтому я закидываю эту идею своим ребятам-коллегам. Не знаю, кстати, сделали они что-то или нет. Просто много всего постоянно происходит, поэтому у меня еще не было времени в общем.

— Понятно. Идею именно со списком пепов закидывали?

— Да. — То есть разделами вы никакими на сайте не пользуетесь, а именно используете его как такой своеобразный Google, да? Вы забиваете фамилию и ищете по ней, по разделам не ходите?

— Да. Нет, по разделам не хожу. Ну, сейчас я вспомню, может быть, ходила какое-то время. Сейчас я вспомню, для чего еще использовала… Нет, чаще всего все-таки я знаю, что мне нужно – мне обычно нужно просто посмотреть, сколько человек зарабатывал официально в какое-то конкретное время или чем он владеет.

— За несколько лет вы сразу проверяете, да? — Ну, по-разному. Иногда за несколько, да, иногда за какой-то конкретный год мне нужно узнать.

— А корректность данных на declarator вы как-то проверяете?

— Да-да-да, обязательно. — Как?


— Сейчас я подумаю. Вы знаете, чаще всего, если

— Да, конечно.

это прямо какая-то важная история, то от меня потребует fact-checker, от меня потребует уже официальный документ, поэтому… То есть declarator я смотрю, так скажем, еще когда у меня происходит какая-то разработка темы, и мне нужно при этом понимать… Ну, я не знаю – условно, есть какая-то очень дорогая недвижимость у человека, и я хочу понимать: он вообще мог себе ее позволить или не мог? То есть чтобы понимать, есть ли тут тема и т.д. А когда я уже готовлю материал к публикации, уже точно, тогда я все-таки чаще всего иду и ищу на официальном сайте этот документ. Правда, бывает такое, что он не находится, если речь идет о какихто старых декларациях. Но чаще всего все-таки находится. А, да – старых или каких-то незначительных органов власти. Потому что одно дело – декларация президента, ее обычно можно найти, а если речь о каком-то мелком местном чиновнике, то с этим могут быть сложности. И вот тогда у нас с фактчекером происходят разговоры, можем ли мы это использовать как пруф или не можем. То есть чаще всего, конечно, когда нет другого выхода, то ты не проверяешь. Но обычно все-таки я стараюсь это подтверждать уже потом официальными декларациями.

Поэтому тут скорее… То есть я знаю, что была какая-то история, что команда declarator была недовольна, что Навальный на них не ссылается, кто-то еще. Я говорю: да, тут вообще история не про то, что кто-то зажал кредиты, – и мы всегда очень благодарны declarator, – а в том, что каждая ссылка дается не для того, чтобы повысить чью-то цитируемость, а конкретно в утилитарном случае, когда мне надо читателя отправить посмотреть сразу proof. И тут скорее, когда я буду выбирать – отправлять читателя на declarator или отправлять его на официальный сайт, где есть эти декларации, – то я, конечно, отправлю… Даже если я сначала все получила с declarator, скорее, отправлю на официальный сайт, потому что я буду думать, прежде всего, о читателе, а не о declarator, безусловно.

— Понятно. То есть в конечном материале при отсутствии конечной информации на сайте ведомства вы можете поставить ссылку на declarator?

— Да. Но понимаете, как: на самом деле, нам несложно ставить ссылку на declarator, просто мы как-то об этом не всегда думаем, потому что, когда мы говорим про декларации, то это не такое, я не знаю… То есть ссылки мы чаще всего ставим тогда, когда это web-источник, мы на него ссылаемся, и люди сразу могут перейти, посмотреть. А с декларациями просто немножко сложнее, потому что все-таки тут речь идет как раз об официальном документе, поэтому, насколько я понимаю…

— Понятно. — Насколько я понимаю, на declarator еще сложно дать ссылку, потому что, скорее всего… Я точно не помню, как это сейчас работает, но, по-моему… У меня есть ощущение, то если ты даешь URL, то ты попадаешь просто на главную страницу declarator. Вот в этом может быть сложность, потому что, конечно, мне нет смысла кого-то…

— Да, поняла. — Поэтому тут надо, конечно, как-то… То есть я понимаю ваше желание и даже искренне его разделяю, но…

— Нет, вы знаете, это, на самом деле, не основная тема интервью. Я просто спросила в инструментальном смысле, то есть насколько это важно. И еще по поводу задач: то есть вы говорите, что чаще всего одного человека какого-то смотрите, то есть это часть большого полотна, какой-то вашей большой работы, и declarator – это, я не знаю, 5 % или 1 % от всего.

— Да, безусловно. И задачи эти обычно разного рода могут быть. То есть понятно, что это журналистские расследования в целом. Да. Кстати, вот еще вспомнила, зачем я захожу: помимо того, чтобы узнать доход или какая недвижимость есть у человека, еще, например, это хорошо, когда мне нужно узнать, есть ли у человека жена, например, или нет. Где это можно посмотреть? Это можно посмотреть в декларации. Ну, и в плане разводов тоже отслеживается хорошо: жена пропала – значит, развелись.

— Ну да. И глаз у вас уже наметан на то, чтобы видеть это в документе? То есть вам не нужна какаято инфографика специальная, что вот он был женат, стал не женат?

— Ну, как сказать? Кстати… Не знаю. — Или это кажется хорошей идеей? Это тоже одна

— Ну да. — То есть я думаю о читателях, прежде всего. Я

из гипотез.

понимаю, что у вас есть цитируемость, наверное, но я просто не могу читателя отправлять на страницу declarator, когда это нерелевантно.

жет сработать в плане, если куда-то выгружать данные, использовать это уже просто как… Ну, не как declarator, как сайт, а как мета- какую-то информацию. То есть вот если говорить про выгрузку

— Кстати, неплохая идея. Опять же, это еще мо-


этих политиков, то, если можно было бы еще автоматически там же подгружать типа «женат, двое детей несовершеннолетних», – вот это тоже было бы суперполезно, чтобы потом вместе выгружалось.

— Ну да. Пожелание.

— Понятно, да. Скажите, а были ли когда-то у вас

— А помимо журналистов-расследователей, как вы

задачи, какие-то идеи что-то сделать на declarator, – просмотреть, найти кого-то, – и не удалось, не нашли, что-то не сработало?

думаете, кому еще могла бы пригодиться, на ваш взгляд, такая полнота информации?

— Да, то есть это действительно пожелание – то, что следует добавить.

— Да, именно, это не недостаток.

— Следователям!

— Да, безусловно, было. Но это было с такими, более мелкими, по-моему, чиновниками. То есть, насколько я понимаю, вы сначала выгружаете самых главных, потом чуть менее главных. И вот мне кажется, с какими-то районными историями у меня что-то не находилось.

— Логично! — Если бы кто-то занимался всерьез этим… Ну, я

— А, тогда вы идете в его офис? — Нет.

думаю, следователям, то есть действительно, на самом деле, это не шутка. Всем правоохранительным органам, налоговым органам. Хотя они, может быть, напрямую как-то посылают. Но вообще, когда всё в одном месте – это, конечно, дико удобно. А, знаете, что? Вот! Я просто подумала: а почему бы вам… То есть сейчас у вас это как выглядит? Это типа данные на сайте о декларациях. А нельзя ли сохранять сами декларации, чтобы они тоже хранились, чтобы я могла у вас же скачать тот документ, который я могу найти потом на официальных сайтах?

— Ну, в смысле, на сайте. — Тогда на сайте declarator, да, я иду в Архан-

— Я поняла. — Это уже, скорее, предложение.

— И вы только через вот это главное поисковое окно пробовали, да?

— Да. Нет, почему? Не обязательно. То есть если я ищу какого-то чиновника из местного парламента, я не знаю, Архангельска, тогда…

гельск и смотрю вот это.

— Да. Я, на самом деле, приглашенный социолог — Поняла. А вы, когда работаете с данными declarator, в одиночку работаете, или с кем-то задачи именно по declarator разделяете? Бывало такое, что разделяли? Наверное, обычно в одиночку? — Нет, не разделяем. Я даже не очень себе представляю, что вы имеете в виду.

— Ну, просто если там нужно большой объем, например, посмотреть – такого не было, да? — Нет, у нас бывает такое, что нам нужен большой объем, но мы делим это не в рамках declarator, потому что declarator – это не основной наш инструмент, это только один из. То есть мы, условно, делим между собой людей, а дальше уже каждый самостоятельно заходит на declarator.

— Поняла. Какие проблемы и недостатки вы видите в работе declarator? — Сейчас подумаю. Это, честно говоря, как-то сложно сказать, потому что, в принципе, меня все устраивает. Ну, хотелось бы, чтобы там был полный спектр людей из России, которые когда-либо должны были отчитываться о своих доходах. Но я знаю, что у вас есть не все. Ну, это, наверное, единственная такая моя…

для declarator, поэтому у меня ощущение, что так можно, но я уточню.

— Ну да, мне не обязательно отвечать, я просто накидываю что-то, что было бы полезно.

— Да, супер. Если еще возвращаться, – ну, собственно, не возвращаться, а продолжать про направление развития проекта, – может быть, было бы полезно агрегирование данных по каким-то основаниям? Вот вы, например, говорите, что семейное основание вам интересно посмотреть, что за пучок данных по семье.

— Да. — Как еще можно? Для вас было бы полезно как? — Ну, не знаю даже, что смотреть. Ну да, кроме семьи – агрегирование первоисточников. Если бы первоисточники у вас тоже можно было бы скачать, это было бы хорошо.

— А вот – тоже не знаю, насколько это актуально – бывает ли, что вам кажется декларация подозрительной? То есть нужна ли какая-то идентификация подозрительных деклараций? Понятно, что это не проблема самой площадки, а декларации.

— В каком смысле подозрительных? Что там дан— Претензия.

ные не соответствуют действительности?


— Да. Или ошибочных. — Ну, типа что люди сами врут о своих доходах?

по возможным способам статистической обработки, то, может быть, вы были бы ближе к этой обработке? Или вам все равно, вы таким не занимаетесь?

— Да. Либо ошибка может быть – ноль ошибочно

— Ну, конкретно я – нет.

проставлен, что-то такое.

— Ну, ошибок – я не знаю, они всегда говорят, что у них ошибки, когда найдешь, несоответствия… Но, конечно, да, это, в общем, сплошь и рядом происходит. Декларации все, я бы сказала, 90 % подозрительные.

— Понятно. — Единственное, что бывает такое: мне, например, нужно ранжировать депутатов в Госдуму по доходам, чтобы понять, кто там самый богатый. Но declarator, по-моему, предоставляет такую возможность.

— Я поняла. То есть если их идентифицировать как подозрительные, тогда там будет всё красное.

— То есть вы решаете это с помощью declarator

— Ну, в общем, многие были бы, да.

тоже?

— Кстати, да, это еще один важный момент. По— Поняла. Как вы думаете, нужно ли какое-то обучение пользователя сайта? То есть ознакомительная обучающая информация: какие виды данных, что на сайте можно сделать? Нужно ли что-то такое?

тому что, когда скачиваешь декларацию с сайта Госдумы, там же они просто в алфавитном порядке, а ранжировать по доходам – это тоже очень полезно бывает, и я это делаю на declarator. Кажется! [смеется]

— На самом деле, у меня был один конкретный случай, когда я сделала ошибку в материале, и это могло бы быть решено с помощью каких-то обучающих материалов. Просто бывает, что...

— То есть иногда и в Excel вам самой приходится, руками, но возможно и на declarator, кажется?

— Нет, я в Excel точно не делаю это! Я точно это делала где-то, но… По-моему, на declarator.

— Именно с declarator, из-за declarator? — Нет, естественно, из-за себя – пойди ты посмотри федеральный закон! Я имею в виду, что я столкнулась с такой проблемой только один раз. Это был какой-то очень такой конкретный случай, когда там была декларация предвыборная, выборы были в 11-м году, а декларация предвыборная за 10-й год. И только потом я... Короче, я не могла понять, в чем дело, немножко не досмотрела, недоресёчила закон. Потом я поняла, что действительно, когда ты избираешься в 11-м году, ты должен предоставить сведения о доходах за 10-й год. То есть те компании, которыми ты владел в 10-м году, поэтому там стояла цифра, в предвыборной декларации, 2010, а я думала, что это ошибка declarator.

— А, понятно. — Ну, вот какие-то такие минимальные пояснения, в принципе, могли бы быть полезны. Но, с другой стороны, почему вы должны разжевывать всё до такой степени, если это всё можно собрать по открытым источникам?

— Ну да, конечно. Речь не идет о том, что это какое-то обязательство. Просто интересно, с какими проблемами кто из пользователей столкнулся.

— Ну да, вот конкретно у меня был такой случай. — Я так поняла, что расчеты статистические для вас не очень актуальны? Или, если бы был ликбез

— Я немного прочитала про ваш опыт работы… Я, правда, не нашла, к сожалению, – я поэтому и спрашивала, собственно, про ссылки на declarator, потому что я не нашла, где вы конкретно с ним работали. Но вот когда вы говорили про работу с панамским архивом, вы говорили, что вам понравилось устройство работы, что это был некий поисковик по панамскому архиву и форум к нему.

— Да. — Я не знаю, вы считаете это адекватной моделью для declarator, или это, скорее, для разнородных материалов хорошо подходит?

— Ну да, это совсем разные, конечно, вещи. Но это было пространство коллаборации, там были миллиарды документов, и это совсем не релевантно в общем случае с declarator.

— Понятно, да. Если говорить об иностранных коллегах: если они что-то спрашивают у вас о российских декларациях, то вы, скорее, сами их посмотрите и предоставите им, или советуете источник типа declarator?

— Ну, это зависит… Если им нужно много каких-то данных по разным людям, по декларациям, то я их, наверное, скорее всего, отправлю на declarator. А если нужен какой-то конкретный человек, то я, скорее всего, найду им этот документ и пришлю, по одному. Ну, и всё зависит от того, говорят ли они


по-русски, насколько кириллицей удобно пользоваться и т.д.

— Класс! Спасибо большое. — Спасибо большое вам.

— Понятно. И последний наш раздел – это про фандрайзинг, про возможность сбора денег. Как вы думаете, каковы вообще перспективы проекта по возможностям привлечения пожертвований?

— [смеется] Ну, мне сложно сказать, вам виднее, конечно…

— Я понимаю, да, что вы не специалист. — …в команде declarator. Ну, условно: если бы у меня было много денег, я бы дала их на declarator.

— То есть вы видите возможный формат как лично от пользователей, да, жертвования, или от работодателя?

— А, нет-нет! Такого нет! Я больше про какие-то фонды, какие-нибудь антикоррупционные инициативы. Да не, я не думаю, что пользователи будут, к сожалению, на это жертвовать особо. Но в плане того, что надо продвигать… На всякие, в том числе какие-то зарубежные фонды, которые поддерживают всякие антикоррупционные движения – тут должны быть вполне хорошие перспективы. Я бы посоветовала, так скажем, дать на это денег, если бы меня спросили.

— Какие-то конкретные фонды вы имеете сейчас в виду? Нет.

— Понятно. То есть вы, скорее, за институциональный путь, чем за обращение к личному?

— Да не то что я «за». Я просто думаю, что это более перспективно в данном конкретном случае, потому что это такое… Ну, при всей любви к declarator – это больно утилитарная штука, это не какойто, я не знаю… Ну, то есть явно не general audience, которая пользуется этим. Но собрать эти данные [из деклараций] вместе, на самом деле, важно. И, в общем-то, да, поэтому я думаю, что если это объяснить фондам каким-нибудь, которые это поддерживают, то они дадут денег. Вот так.

— Да, поняла вас. Мы подошли к концу интервью. Если у вас есть какие-то дополнения или комментарии, что-то мы не затронули…

— Мм, нет, пожалуй, у меня больше не осталось никаких комментариев.

— Спасибо большое. Тогда мы расшифруем, и если у меня вдруг появятся вопросы, я вам, если можно, напишу. Но я думаю, что, по идее, не должно остаться вопросов.

— Да без проблем! Конечно, пишите, звоните, я на связи.

— Всего хорошего. — До свидания.


— Когда вы заходили на «Декларатор» в последний раз? — Сегодня.

— Какую задачу решали? — Надо было найти насчет чиновника вновь назначенного, что-то добавить туда надо было.

— То есть вы сегодня и добавляли тоже? Не только как пользователь? — Нет, сегодня ничего не добавлял. Но что-то смотрел, да. Вчера добавлял.

— Как можно охарактеризовать вашу модель использования сайта, то есть в каких случаях вы обычно обращаетесь к «Декларатору»? — Когда надо посмотреть что-то, какой-то бэкграунд какого-то чиновника.

— Обычно это один человек, то есть не группа людей? — Да, один человек. Есть такое, что и группы людей. Если дело касается какого-то ведомства, где не так много людей, то там да. Там несколько человек смотрится.

— Но в любом случае это работа с единичными декларациями, а не какой-то статистический анализ, например? — Нет, большой пока не делали. Пока нет таких объемов данных, которые можно было бы анализировать, скажем так, по тем проектам, по которым я работаю. Там еще недостаточно много деклараций, скажем так. Мы работаем над тем, чтобы сделать больше.

— Раньше тоже у вас не было задачи проанализировать большой объем? — Пока нет, да. Пока не было. Сейчас в процессе, потому что для того, чтобы анализировать большой объем, сначала надо этот объем занести.

— Это точно. Вы, вообще, с какого года начали пользоваться «Декларатором»? С самого момента его появления, наверное? — Я не знаю, но давно. Как начал заниматься расследованиями, так и занимаюсь «Декларатором». Лет 6, может быть.

— Ваша задача обычно это расследование, то есть вы всегда смотрите какую-то декларацию для того, чтобы потом ее вписать в расследование, где вы используете еще и другие данные, я правильно понимаю? — Когда-то, наоборот, мы отталкиваемся от декларации. По-разному, на самом деле.

— Вы заметили что-то подозрительное, и из этого рождается расследование? — Да. Какой-то странный чиновник. Надо посмотреть, кто это такой, что у него там за недвижимость. Так, понятно. Дальше незаконное обогащение, еще какие-то такие вещи.

— Вы как-то еще проверяете то, что вы видите на «Деклараторе»? — Конечно. Там же указаны только площади, а я ищу именно объекты недвижимости, например, или автомобили, или еще какие-то вещи.

— Когда вы ищете конкретного человека, вы пользуетесь поисковым окном или идете в ведомство, где работает человек? — Поисковым окном. Если не находится, то ведомство смотрим.

— Вы знаете об этой особенности, что если поисковое окно не сработало, то нужно посмотреть там? — Да, конечно.

— Какими разделами вы пользуетесь? — Сложно сказать.

— Собственно, этими и пользуетесь (окном и офисами)? — Окном. В основном окном, конечно. Там по органам власти ищу либо по чиновникам. Мне проще по органам власти найти сразу и там уже смотреть чиновника или чиновника и через него уже орган власти смотреть.

— То есть вам так проще? — Конечно, как-то так.

— Когда вы проверяете корректность данных, как вы это делаете? Я правильно понимаю, что потом вы как-то можете это отразить на «Деклараторе», что эти данные какие-то подозрительные, или не отражаете? — Нет, это никак не отражается.


— Только в ваших расследованиях это отражается? — Да. Там же некуда добавить адрес (да и, наверное, это не нужно).

— Что еще, помимо данных «Декларатор.орг», какие ресурсы вы еще используете? — Росреестр, ЕГРЮЛ, Контур-Фокус. Много чего. Их много. OpenCorporates, я не знаю, поиск по соцсетям, какие-то специфические сервисы, какието заграничные реестры, то есть по-разному.

— Зависит от конкретного случая. — Конечно.

— Вы всегда работаете в одиночку с данными на «Деклараторе» или когда-то разделяете с кем-то задачи? — У нас это иногда делают стажеры.

— То есть вы даете задание, в том числе и по «Декларатору»?

секретный раздел адреса найденных объектов. Тоже ничего такая штука.

— Это должно быть в форме секретного? — Для внутреннего пользования. Понятно, что это персональные данные.

— А поиск мужа и жены, это, соответственно, можно сделать открытым сервисом? — Конечно.

— Есть идея, как это могло бы выглядеть? — Это все делается автоматически. Как бы сравниваются просто декларации супругов. Там, где супруг и супруга, у них будут одинаковые площади, одинаковое все. Это, я думаю, все в автоматическом режиме решаемо.

— Я имею в виду, там не нужен никакой специальный дизайн? Можно сделать какой-то простейший вид, который будет понятен пользователю? — Конечно.

— Конечно.

— Есть какая-то специфика в том, как вы даете задания? Может, у стажеров возникали какие-то проблемы именно с «Декларатором»? — Нет. Мы сначала обучаем, а потом контролируем. Условно, надо всем поправить муниципалитеты. Сидят, помогают всем муниципалитетам, потом просто проверяем качество сделанной работы.

— Вы лично проверяете каждую введенную декларацию? — Необязательно я. Сотрудники. У нас, в принципе, все умеют пользоваться «Декларатором».

— Для вас это просто ежедневная рутина? — Да. Что-то зайти, что-то посмотреть. Нет, бывают дни, захожу, бывают, не захожу. Это же не то, что я прямо прихожу и сижу в «Деклараторе». И других много задач.

— Может, еще о каких-то новых возможностях у вас есть идеи, что можно было бы добавить для более эффективной работы? — Не знаю. Возможность декларации в соцсетях как-то шарить красиво, чтобы какая-то форма в Facebook, в Twitter, ВКонтакте добавлялась. Сейчас этого нет.

— Прямо саму декларацию или то, как она выглядит на «Деклараторе»? — Декларацию, которая с «Декларатора», то есть, условно, нажимаем на декларацию какого-нибудь Владимира Владимировича Путина, нажимаем кнопку «Расшарить где-нибудь в Twitter», например, и чтобы это опубликовалось в виде какой-нибудь красивой таблички. Это было бы, конечно, удобно. Какой-то код, я не знаю.

— Код для этой функции? — Да.

— Вы можете припомнить такие задачи, которые вы планировали решить с помощью «Декларатора», но не смогли? Я не знаю, насколько для вас релевантен этот вопрос. Вы, скорее, будете что-то менять в «Деклараторе», если видите, что что-то не так? Может быть, собирались что-то сделать? — Нет, наверное. Не могу сказать, что есть что-то такое. Понятно, что есть какие-то вещи, которые хотелось бы там сделать. Я не знаю, поиск мужа, жены или возможность добавлять куда-нибудь в

— То есть красивая ссылка на соответствующую страницу «Декларатора»? — У нас некрасиво…

— Понятно, что это будет сразу контент. — Да, какая-то графическая.


— Вы говорите, что было бы хорошо показать семейные связи. А какие-то еще связи, еще какие-то возможные связи нужно показывать, как вы считаете? — А какие еще можно при помощи этого связи показывать? Я не очень понимаю. Если муж с женой, там понятно. У них там все будет идентично, просто местами будет поменяно, и это в автоматическом режиме будет очень легко искать. А все остальное…

— Может быть, например, какие-то бывшие коллеги. Это актуально или, скорее, нет? — А как там сделать? Карьерный путь как бы и так понятен. Если все декларации сотрудников внесены, то, в принципе, карьерный путь можно легко отследить. Оно же там прямо в «Деклараторе» есть. Там прямо видно.

— То есть самый бедный, богатый чиновник различных ведомств, какое-то резкое изменение благосостояния. — Да, что обычно в рейтингах у журналистов бывает. В основном, богатые жены. Самые дорогие автомобили сделать сложнее, потому что стоимость автомобиля прикручивается. Я думаю, что это не очень легкая задачка. Тем не менее, какието такие вещи можно.

— Как считаете, насколько сейчас актуально работать над настройкой API? — Я думаю, что это надо, чтобы все спокойно могли использовать эти данные и заодно как-то популяризировали «Декларатор», помогали его развитию.

— Просто это будет не машинно, а нужно будет заглянуть в каждую декларацию?

— Я понимаю, что это не совсем специфика вашей работы, но по статистическим инструментам нужна ли какая-то интеграция, например, со стат-пакетами?

— Да.

— Я в этом ничего не понимаю.

— Вы считаете, что это не нужно делать более автоматическим, чем это есть сейчас?

— Нужна ли какая-то, может быть, специальная идентификация подозрительных деклараций?

— Да сейчас и так все, в принципе, понятно.

— Какие-то маркеры да, могут быть. Например, самое простое, если чиновник бомж. Нет никакой недвижимости. Понятно, что это недостоверные сведения, и тут надо сразу как бы высвечивать такие декларации и делать какие-то юридические вещи. Если чиновник или жена чиновника бездомный, или ребенок бездомный. Были мысли так сделать, но пока не сделано. Сейчас, вообще, в принципе, невозможно добавить на декларацию какого-то супруга или супругу, если у них нет ни дохода, ни недвижимости, ни машин, то есть их вообще нет в базе. Это, кстати, такой очень неприятный баг, потому что они вообще из статистики выпадают.

— Агрегировать данные по каким-то основаниям, по регионам. Может, еще какие-то основания нужны для агрегирования? — Нет, какую-то статистику можно сделать, особенно для журналистов, которые работают с «Декларатором».

— Какую, например? — Даже не знаю. Самый бедный, самый богатый чиновник органов власти. Брать какое-нибудь Законодательное собрание, и чтобы он там показывал. Автоматически показывать чиновников, у которых изменилось благосостояние, то есть они продали или купили что-нибудь. Странные отклонения в доходе, то есть зарабатывал человек по миллиону, а тут раз – и 10 миллионов заработал. Такие вещи тоже можно как-то сделать в автоматическом режиме, я думаю.

— Может, еще у вас есть какие-то идеи из вашего опыта?

— Да. То есть нулевую декларацию нельзя отразить? — Не нулевую декларацию чиновника, а нулевую декларацию супруги или ребенка, то есть его просто не будет на «Деклараторе».

— Это проблема не «Декларатора», то есть он в данном случае… — Нет, «Декларатора». Он просто не отображает.

— Наверное, нет.

— То есть «Декларатор» мог бы отображать этот ноль в родственниках, но не отображает? — Да. Какую-то кнопку надо, чтобы 0, именно 0, потому что сейчас 0 воспринимается как 0. Сейчас 0 воспринимается как…


— Нет такого.

— Да. Понятно, что это, скорее, не для вас вопрос.

— Да.

— Для обычных пользователей или, если у вас есть опыт объяснения стажерам, то что это за ликбез? Стажеры занимаются тем, что вносят сведения о доходах. Мы подробно объясняем, как вносить, что вносить, куда вносить, какие-то вопросы, которые появляются («А куда это добавлять? А куда это добавлять? А почему тут этого нет?»).

— Нет такого человека, хотя он есть. Просто у него 0 в декларации. Это маркирование подозрительных деклараций. У вас есть какие-то соображения, как это лучше сделать (поместить на главной странице или подсветить цветом)? — Я думаю, какую-то отдельную статистику. Все равно нужно, чтобы все это обработалось и, условно, раз в неделю, может быть, особенно в декларационный период раз в неделю можно делать такую статистику, обновлять в тот момент, когда добавляются сведения о доходах, а потом как бы пореже, чтобы не нагружать сервер.

— То есть сделать такой отдельный раздел? — Да.

— Может быть, еще какие-то недостатки или направления для дополнительной работы видите? — Больше нет, наверное.

— Из перечисленного для вас как для пользователя что наиболее существенно? Что, может быть, затрудняет вашу работу? — Нулевые дела.

— В вашем расследовании такое «белое пятно», получается. — Это важно для исследований на самом деле. Как сейчас получается? Делаем какое-то исследование по муниципалам, вносим их сведения о доходах. Вносим и отдельно приходится выписывать тех, кто не указал никакой недвижимости у себя, у ребенка или у жены, то есть отдельно это выписываем, потому что автоматически эту информацию потом не снять. Было бы намного удобнее все внести, нажать кнопку и получить данные.

— Если говорить об идеальном «Деклараторе», мы добавляем все, о чем мы сказали. Еще что-то добавляем или что-то убавляем? Или после добавок он идеален? — Нет, если добавится, то, в принципе, пока вопросов больше не будет.

— Как вы думаете, нужна ли какая-то ознакомительная или обучающая информация о видах данных, которые есть на «Деклараторе»? — Вы имеете в виду для кого? Для обычных пользователей только если.

— То есть это люди, которые изнутри работают, а как пользователям им все понятно? — Да. На самом деле мне сложно сказать, что это какой-то сложный портал. На самом деле информацию найти очень просто. Может быть, добавить какую-то кнопку для пользователей, что я не нашел этого чиновника по «Декларатору», чтобы приходило уведомление, что нужно, чтобы кто-то, чтобы чья-то декларация была расшифрована. Какой-то такой звоночек, маячок, что этим чиновником интересуются и можно добавить.

— Это, скорее, форма обратной связи, чем какоето обучение, потому что обучение не требуется? — Да. Скорее так. А обучение? А чему там обучать? Как набрать фамилию, имя, отчество или выбрать из списка?

— Это опять же не ваша специфика по работе с табличными данными – но, если выгружается массив, нужен ли ликбез. Вы считаете, если человек специалист по массивам, он сам разберется? — Конечно. В основном с массивами все-таки работают те люди, которые умеют с ними работать, а те, кто не умеет работать с массивом данных, ну выгрузят они и будут сидеть, смотреть на него. В чем смысл?

— У нас остался последний раздел — по возможности сбора денег. Как вы оцениваете перспективы проекта в этом плане? — Я думаю, что это в отрыве от сбора денег в самом «Трансперенси» будут воспринимать достаточно сложно, потому что система должна быть единая, и придумывать что-то свое будет, по меньшей мере, странно, потому что это все равно будет идти и за счет «Трансперенси». Понятно, что там какие-то свои маркеры для фандрайзинга будут стоять. Когда деньги будут приходить на «Декларатор», их можно будет как-то отличить, тем не менее, система должна быть сделана, то есть там должна быть возможность добавить, например, ежемесячные платежи. Эта система должна быть в целом. Не только у «Декларатора». Есть же и другие проекты. Это везде должно быть.


— А у «Трансперенси» сейчас нет такой системы? — Пока все на коленке.

— Вы считаете, что здесь основное, с чем нужно работать, — это чтобы была цивилизованная макросистема? — Да, она должна быть. Ее адаптировать под каждый отдельный сервис — абсолютно не проблема.

— А в плане аудитории, какую аудиторию вы видите в первую очередь для сбора денег на «Деклараторе»? — В первую очередь это люди, которые так или иначе заходят на «Декларатор», чтобы что-то посмотреть интересное (по большому счету). Журналисты — это тоже, я думаю, такие люди, которые готовы добавить каких-то денег за то, чтобы им было удобно работать с данными.

— В любом случае это не такой четкий договор «Сделайте, пожалуйста, новую функцию, и я ее оплачу»? Это, скорее, общее жертвование? — Нет, это, конечно, общее жертвование.

— Вы говорите, что это, скорее, личные пользователи, чем какая-то корпоративная подписка или какие-то фонды? — Фонды — это немножко другое. Гранты, фонды. Все равно это другая вещь. Фандрайзинг включает на самом деле и то, и другое. На фонды не собирается через сайт. Собирается через заявки, через какие-то остальные вещи. Через сайт собирается фандрайзинг, который с физических лиц, с пользователей «Декларатора».

— И основание, на что собирается, это на развитие проекта в целом? — На то, чтобы проект работал.

— То есть это не доступ к каким-то специальным, особенным функциям? — Нет. Это просто «спасибо вам за то, что вы делаете».

— Еще какой-то комментарий по фандрайзингу у вас есть? — В общем, нет.

— Вчера я, например, разговаривала с журналистом, и она, наоборот, видит это через фонды в

первую очередь, а лично, скорее, не стала бы жертвовать. Это единичное мнение, конечно. — Все по-разному на самом деле. Я могу сказать, что, в принципе, фандрайзинг, если его грамотно продвигать и грамотно настроить, приносит достаточно хорошие деньги не просто на работу, на функционирование проекта, но и на нормальное развитие, потому что люди жертвуют. Это как бы нормально.

— Здесь вы видите проблему, скорее, в том, что не отстроена система в целом, а сам «Декларатор» уже готов к тому… — Конечно. Проблема в том, что системой надо заниматься постоянно. На это должен быть отдельный человек, который будет что-то делать, чтобы оно работало.

— То, как работает и выглядит «Декларатор» сейчас, вы считаете, что это совершено нормально для того, чтобы пользователи жертвовали? — Нормально, да. Понимаете, для того, чтобы жертвовали денег, их надо попросить, как минимум. Люди должны понимать, зачем они будут эти деньги давать. Должна быть понятна причина: «Вот смотрите, какой крутой сервис. Мы над ним должны работать. Дайте нам денег, чтобы это работало дальше и развивалось». Этим должен заниматься отдельный человек. Это должна быть отдельная система. Делать это на коленке, кинуть каких-то пять копеек это, конечно, не полноценный фандрайзинг.

— Да, поняла вас. Мы подошли к концу интервью. Если у вас есть какие-то дополнения, комментарии по тем темам, которые мы затронули? — Наверное, нет.

— Спасибо большое.


— Я предупреждала Андрея о том, что я не самый адекватный спикер по этой теме, потому что почти не пользуюсь «Декларатором», так получается. Но всё, что смогу, — всё ваше.

— Хорошо. Может, тогда у вас настолько мало случаев использования «Декларатора», что вы можете о каждом из них рассказать, рассказать, как пользовались, что искали? Или не настолько мало? — На самом деле, понимаете, всё время что-то ищешь. Но дело в том, что я в любом случае не могу пользоваться… Я просто сейчас не отличу, что я искала через «Декларатор». Поиск перманентно идёт, и вспомнить, что я искала через «Декларатор», а что — нет, довольно сложно. Например, мы пробивали новых министров.

— Сейчас уже, после выборов? — Да. Не всех, а тех, которые пришли, двух-трёх. Фамилии я уже не вспомню, потому что это было в сумасшедшую пятницу. Поскольку там по ним информации совсем мало, то было очень удобно зайти в «Декларатор». Смысл в том, что мы должны брать информацию из первоисточника, и «Декларатор» для нас – ненадлежащий источник, потому что он фактически копирует информацию, а мы не можем отвечать за то, насколько точно он её копирует. Поэтому всё равно, даже если что-то там находишь, заходишь подтверждать потом на сайт… – в общем, как-то.

— Но начинаете вы иногда с «Декларатора», получается. — Да. Получается, что иногда начинаем с «Декларатора», потому что это достаточно удобно: забил в поиск, и тебе выдали. Обнаружили, что там нет последних деклараций за 2016/7-й год, хотя теоретически они уже должны были быть там. По тем людям, которые нас интересовали, мы ничего нового для себя не нашли, за 2015-й и 2016-й годы были какие-то данные, и всё.

— А должны быть уже за 2017-й? — Понимаете, в чём дело? Декларации — это такая штука… Помимо каких-то аналитиков… мы же больше новостями занимаемся… но на самом деле не только, конечно… Есть два формата использования этой фигни. С одной стороны, это новость: приходит человек, что-то случается, и ты идёшь смотреть, а что у него с декларацией. Ну и второе: ты копаешь про какого-то товарища, долго и упорно.

— Я поняла. Ваши задачи можно разделить на эти два типа: либо что-то произошло, тогда вы смотрите, либо вы проводите расследование по какомуто человеку. — Да-да. В любом случае, как я уже говорила, «Декларатор» может служить только для ориентира, потому что потом всё равно приходится это подтверждать – какие-то адекватные источники.

— [Для поиска адекватного источника] вы пользуетесь теми ссылками, которые «Декларатор» даёт, или сами ищете? — Слушайте, а я не помню там ссылок. Там есть ссылки, да?

— Я смотрела по нескольким разделам; например, по «Администрации президента» там есть. — Может, есть. Но я не помню, честно говоря, чтобы были ссылки, которые были бы под рукой, чтобы ткнуть и перейти. Это был бы идеальный вариант. Может, я недоглядела.

— Когда вы заходили на «Декларатор» в последний раз? — В пятницу.

— И там вы пользуетесь основным поисковым окном и забиваете фамилию нужного вам человека, правильно я понимаю? — Да.

— По разделам, по так называемым офисам, не ходите, а ищете именно человека? — Мы следим сами, когда офис выдаёт декларацию. Поэтому, если я заинтересовалась офисом, я ловлю самую последнюю информацию, мне не нужен «Декларатор». И потом, как правило, она уже есть в базе. И мы тоже закачиваем себе всё это.

— Понятно. А вы пользуетесь выгрузкой в табличном виде какого-то массива по нескольким людям, или обычно это точечно и единично? — Наверное, скорее единично, потому что, если честно, формат таблицы я просто не освоила. Если там была бы возможность сравнивать, допустим, кто самый богатый (допустим, депутаты выложили свои декларации), была бы возможность ранжировать их по объёму денег, ну площадь там не ранжируешь никак, так как там сложные алгоритмы, то я, наверное, пользовалась бы, но я просто не видела такого. Ещё раз говорю: дурацкая привычка – всё время лезть в первоисточники, закачал себе много страниц и читаешь.

— Кто самый богатый из депутатов… Вы видели, что у них есть рейтинг на первой странице по богатству, как раз по совокупным доходам.


— Не видела, к стыду своему.

— Не обращали внимания. Там первые несколько висят на главной странице – но это, возможно, не ваша цель. — На самом деле, это вопрос технологии. У нас есть люди, которые умеют составить таблицу, быстренько посчитать, кто богаче всех. Нам это не нужно. Не то чтобы я сама это могла сделать – просто есть люди, которые это умеют делать. Это не самое сложное знание.

— Помимо «Декларатора», для того, чтобы посмотреть декларации, вы используете первоисточники, и всё. — А какие есть варианты?

— Может, вы в «Google» забиваете. Я стараюсь понять: «Декларатор» – это скорее ваш первый выбор? — Ещё сайт Центризбиркома, например, прекрасный. Правда, раз в четыре-пять лет… Но когда нужны декларации, то часто отчёты депутатов, особенно если выборы были не очень давно… Потому что там перечень информации полнее, чем они выкладывают.

— Понятно. Предпочитаете, если это релевантно, пользоваться Центризбиркомом. — Да.

цифры, то можно покопать – прошлом году Памфилова очень много заработала, какие-то такие вещи. В принципе, это уже текучка, когда делается какойто рейтинг, и на этом все успокаиваются. Ещё иногда жёны, разводы, заграничная недвижимость.

— То есть если вы видите какой-то интересный факт в том, что сделал отдел информации, тогда вы уже вступаете с собственным поиском. — Можно так сказать, да.

— Цели ваши мы обсудили. Вступаете, если начинаете проверять информацию. Тогда вы сначала тоже идёте на «Декларатор» или начинаете сразу с каких-то других источников? — Конечно, мы сразу начинаем с других источников.

— И ссылку на «Декларатор» вы никогда не даёте, потому что это неофициальный источник. — В принципе, может так получиться, что нет этой информации на сайте, её там, допустим, затёрли, а в «Деклараторе» есть, тогда, наверное, я укажу источником «Декларатор», уточнив, что на официальном сайте информация отсутствует, а на «Деклараторе» такая-то картинка.

— Какие проблемы и недостатки вы видите в «Деклараторе»? — Я сказала: запоздалое появление информации.

— Если вы работаете с «Декларатором», то, как я понимаю, делаете это обычно в одиночку, не делите задачи с коллегами – ты смотришь это, я смотрю это. — У нас есть отдел информации, который больше оперативки обрабатывает в последнее время. Ещё года три назад мы сидели на этих декларациях, как бы по умолчанию. А сейчас уже ребята навострились, сами всё делают, а мы только смотрим, у кого что больше, у кого – меньше. Меньше стало этой работы, она ушла больше в отдел информации. То есть это уже не такая новость, как три года назад.

— Получается, вы это реже делаете руками. Но, возможно, вы проверяете то, что сделано? То есть вы сами не лезете в декларации, чтобы что-то посмотреть, какие-то простые факты; вы говорите, что этим занимается отдел информации. — Ещё раз говорю, что мы работаем в формате новостей. Выложили декларации – мы начинаем их смотреть. Раньше, три года назад, я сидела и их смотрела, сейчас это делает отдел информации, быстренько забивает таблицу «10 самых богатых», ещё что-нибудь. Собственно говоря, на этом работа заканчивается, потому что там каких-то открытий… если появляются какие-то интересные

— Ещё что-то — в дизайне, в функционале? — Слушайте, кого волнует дизайн, когда информация нужна?

— Для вас наиболее существенно — запоздалые публикации, всё остальное несущественно. — Да.

— О проблемах поговорили. Поговорим о том, как может выглядеть идеальный сайт «Декларатор». Всё вовремя, и это всё, что важно для вас? — Была бы интересна система, которая позволяла бы анализировать информацию, сравнивать связи, вытаскивать какие-то аномалии. Сильные колебания у товарища были: было по 5 миллионов дохода, а потом — 90; вот и можно узнавать, с какого перепуга, не лазить самой, не сравнивать. Вот это могло бы быть интересно.

— Система для анализа. Во-первых, это представление необычных данных, какое-то подсвечивание их. — Не представление, а выявление каких-то аномалий.


— Подсвечивание таких аномалий и возможность посчитать что-то. Как это должно выглядеть примерно? — Возможность анализа.

— Как вы считаете, нужна ли какая-то ознакомительная, обучающая информация о видах данных, которые есть на сайте «Декларатор»? — Чёрт его знает. Мне и так всё понятно.

— Проследить, когда и как появилась эта аномалия.

— И у вашего отдела информации тоже не возникает вопросов, они нормально работают.

— Да.

— Да.

— Такая задача может стоять перед журналистами, журналистами-расследователями, новостными журналистами.

— Как вы считаете, нужен ли какой-то ликбез по возможностям обработки данных, по тому, как можно расчёты делать в этих таблицах уже агрегированных данных?

— Естественно.

— Вы сказали про выявление связей — какие связи вы имеете в виду? Семейные, наверное, может, ещё какие-то? — Хороший вопрос. Про связи я сказала с перебором, потому что там настолько ограниченная информация, что связей там никаких не вытащишь.

— То есть не имели в виду даже семейные связи, да? — А что семейные связи? Три одинаковые фамилии в «Деклараторе». Поскольку у нас есть закон о персональных данных, будет довольно сложно… можно, в принципе, но не думаю, что это суперактуально. Конфликты интересов? В принципе, может быть такое, что там Чайка и Чайка, но тогда нужно, чтобы второй Чайка тоже был в рамках системы и какие-то декларации выкладывал. В общем, при нынешнем объёме информации, конечно, вряд ли. Скорее просто неровности и расхождения – была квартира в Испании и исчезла; было три, а стало пять.

— Наверное, нужен, потому что многие юзеры этого могут не знать. Это зависит от таланта той аудитории, на которую вы рассчитываете. Мне было бы интересно, потому что я с таблицами плохо работаю. Если было бы нужно, я бы пошла и поучилась, если совсем припёрло бы.

— Если это было бы размещено на сайте, то вам это было бы интересно в форме видео или текстового описания? — Текста, конечно. Кто ж видео-то смотрит, неудобно же.

— Если у вас есть что добавить по желаемому функционалу, по каким-то проблемам… — Вроде нет.

— Тогда перейдём к последнему разделу – про возможности сбора денег. Как вы оцениваете перспективу проекта в этом вопросе? — Дело хорошее.

— Потенциал есть. — Понятно. А какие-то самые скандальные или заметные факты — самых богатых жён, самых дорогих автомобилей?..

— Да.

— Даже самые дорогие автомобили вы не вытащите оттуда. У нас был случай, когда мы писали про машину, писали, что у чувака Land Rover какойто там, а он потом пишет возмущённое письмо: моему Land Rover’у 12 лет и стоит он 300 тысяч. Ещё раз говорю: там объём данных такой, что вы достаточно адекватную информацию, скорее всего, не вытащите. Вы можете вытащить марку машины, но не вытащите её год, вот и всё. Вы, конечно, можете посчитать, сколько лет она во владении, потому что её декларируют годами, или посмотреть, что пришло, что ушло, но не более того. То же самое с недвижимостью: где участок, какой участок?.. Ни о чём.

— Наверное.

— То есть сами по себе данные не могут быть в полной мере доказательной базой. — Абсолютно.

— А лично вы стали бы участвовать в сборе денег?

— Однократно? Или скорее оформляя какую-то подписку? — Наверное, однократно.

— Вы считаете, что здесь перспективно будет общение с отдельными жертвователями или институционально, с фондами? — Фонд — это структура, он всегда более эффективен, наверное, чем это самое, но требуются определённые усилия, немножко инвестиционных и так далее.

— Вы считаете, что будет достаточное количество пользователей, готовых жертвовать?


— Если вы будете раскручивать это дело как антикоррупционную эту самую, то да. Я ещё раз говорю, что это всё равно работа.

— А какая сумма для вас была бы комфортной? — Не знаю. Тысяча рублей.

— И это было бы просто пожертвование на то, что попросит команда, — необязательно допуск к каким-то спецфункциям, необязательно какой-то спецпроект. — Конечно нет. В качестве благодарности.

— Я не спросила, с какого времени вы начали пользоваться «Декларатором». — Не могу сказать. Я помню, как он создавался на моих глазах. Наверное, года два.

— И каких-то изменений за это время не заметили? Он для вас ровный ресурс всё это время? — Я достаточно редко им пользуюсь, чтобы чётко анализировать его как инструмент работы. Спросите меня про сайт Центризбиркома — я отвечу, про «Декларатор» не отвечу.

— Спасибо вам большое.


— Респондент-2: Вопрос такой. Это чистые данные? Где-то находятся… — Андрей: Так, вопрос еще раз тогда.

— Андрей: Машиночитаемые?

— Респондент-1: Ну, на самом деле, он несколько шире. Интересует в принципе размер базы, который должен был туда попадать. То есть верно ли, что все сдают декларации, кто должен был сдавать? Интересно в годовом разрезе (соответственно, сколько должно было сдавать, сколько сдало), какой размер покрытия в региональном масштабе и относительно организаций (как я понимаю, это те уровни, которые вы точно затрагиваете). Соответственно, есть ли какое-то представление об этой выборке?

— Респондент-2: Да. Откуда, где raw data.

— Андрей: Ну, представление о выборке есть — к сожалению, нет четких цифр, потому что самый первый слайд, который я вам показывал, говорит о том, что есть разные категории. Наша база, там есть некий функционал, который изначально был настроен на то, чтобы мы собирали данные по количеству людей, которые в каждом файле содержатся. К сожалению, этот функционал не используется сейчас, то есть мы не ведем эти записи; мы предусмотрели, может быть, для какого-то количества файлов записали. Есть несколько уровней у этой проблемы. Во-первых, то, что нету какого-то сводного реестра, который бы утверждал сводный список должностей или людей, которые обязаны, подотчетны. То есть для каждого элемента этого паззла есть свое нормативное регулирование, и это нормативное регулирование не всегда выражено в численном выражении. — Респондент-2: Так нет такой центральной платформы, центрального пункта? — Андрей: Да, система децентрализована. Например, возьмем какое-нибудь министерство, в министерстве есть приказ, чтобы лица, замещающие должность начальника отдела, должны публиковать декларации. При этом на момент декларационной кампании, декларационного периода некоторые должности начальников отделов могут оказаться вакантными. Исполняющие обязанности государственных служащих не публикуют эти декларации, и мы не можем, то есть мы оказываемся в ситуации, когда мы не понимаем, было ли какое-то умышленное. То есть для нас, для transparency, интересно, было ли это умышленное, можем ли мы написать жалобу или нет, является ли законным это отсутствие декларации. Для того, чтобы это понимать, нужен достаточно тщательный анализ каждого случая производить, который оказывается невозможным в силу огромного поля.

— Андрей: Raw data – это вот этот файл. Этот файл или другой файл, это 55 03:35. — Респондент-2: Но Вы сказали, что это несколько процентов. Остальные – это они где-то на бумаге? — Андрей: Нет, они… Условно говоря, мы берем файл, в котором есть 300 человек, это министерство… — Респондент-1: Это, как правило, Excel, PDF, Word? Или все вместе? — Андрей: Все подряд. — Юлия: Даже jpeg есть. — Андрей: Да. Но основная часть — это doc, вордовские файлы. — Респондент-2: Это файлы с декларацией? — Андрей: Да-да. То есть обычно это таблица такая какая-то, она может быть в doc-формате… — Респондент-2: А где есть сами декларации? — Андрей: Мы их забираем с интернета, собираем эти файлы. Мы их собираем, потому что они могут быть изменены после публикации, либо они могут быть удалены после публикации. Соответственно, мы занимаемся их архивированием и в этом как раз центральная единица, центральная часть этого проекта – это как раз архивная часть, хранение данных. Если мы говорим о полноте, то есть мы по некоторым категориям проводили исследования, например, было исследование по региональным депутатам, депутатам региональных законодательных собраний. Мы проводили это исследование, и мы обнаруживали, что там есть огромное количество лиц, которые уклоняются от этой обязанности декларироваться. — Респондент-2: Есть такие? — Андрей: Да, их очень много. То есть их там несколько тысяч выявили, но там всегда это упирается в то, что мы смотрим дальше, оказывается, что, например, к этим людям на региональном уровне не был принят нужный нормативный акт. То есть мы упираемся в ситуацию разбора конкретного человека или конкретного института и каждый раз обнаруживаем какие-то новые слои, они могут быть связаны с нормативно-правовыми актами либо с замещением конкретных должностей, либо как-то еще, каких-то людей нет. Но в целом наших ресурсов не хватает на то, чтобы отслеживать полноту этих данных. Мы собираем то, что есть, какие-то, по верхам, если мы видим, что, условно говоря, какого-то министра не хватает, мы, конечно, про это какие-то действия предпримем.


Но если мы видим, что не хватает людей на какомто очень низком уровне, я это просто пропускаю, это очень часто бывает, но обычно этому находится какое-то хитрое объяснение.

пощупать коррупционность, и они разного уровня. То есть у нас есть проект по госзакупкам…

— Респондент-2: Мы знаем, где они должны официально публиковать эти документы?

— Андрей: три проекта по госзакупкам.

— Андрей: Да, это на официальном сайте. Мы собираем с официального сайта. Я ответил на вопрос? — Респондент-1: Да, да. Я так и подозревала. Я, что называется, пробовала работать с госорганами, и там даже не всегда реально получить, сколько людей работает. То есть мы входили в администрацию Красноярского края, нам дали список должностей, но какие заняты, а какие не заняты – это они отказались говорить. — Андрей: Я понимаю этот вопрос. У меня была в какой-то момент исследовательская идея; она еще есть, но она малореализуема, как оказалось, она разбилась о лодку реальности. Есть некий предельный численный состав, если мы берем федеральные органы власти, предельный численный состав органов власти, который утвержден указом президента или постановлением правительства (в зависимости от того, кому подчиняется тот или иной орган власти). И у нас есть декларации, есть количество людей, которые в каждой декларации фигурируют, и есть некая пропорция относительно предельного численного состава. Если мы, например, возьмем министерство обороны, в котором 35 тысяч человек и которые без должностей, пронумерованы; кроме того, что мы не можем их идентифицировать, мы не понимаем, кто из них является государственным служащим центрального аппарата, кто является военнослужащим не центрального аппарата, кто является сотрудником подведомственной организации, руководителем. То есть здесь немного иногда все в кучу, и это, конечно, очень сильно может спутывать. — Респондент-1: Мне кажется, что к военным лучше вообще не соваться. — Андрей: К военным? Ну, они просто самые жирные. — Респондент-1: И самые закрытые при этом. — Андрей: И самые закрытые. … — Респондент-1 (говорит с респондентом-2): It is comparable to the public procurement stuff where you have pictures and run script to collect data… — Андрей: Я немного пропустил тему обсуждения. — Респондент-1: Мы между собой просто обсуждали. У нас есть несколько проектов, где нам интересны любые данные, связанные с возможностью

— Респондент-1: У нас есть проект по госзакупкам и в госзакупках они… — Респондент-1: Нет-нет, я называю это «один проект по госзакупкам». — Андрей: В трех частях. — Респондент-1: Там идея, как устроены закупочные данные. Какая у нас была идея? Возможность попадания (?), то что есть ответственный за закупку. Попадает ли ответственный за госзакупки в число тех, кто должен подавать декларацию, это вопрос открытый. — Респондент-2: Идея такая. Те люди, которые больше, они опубликуют. Или, скажем, у них есть даже машины, которые намного дороже, это уже сигнал. — Андрей: Если они не публикуют данные, ответственные за закупки… — Респондент-2: Да, они скрывают… — Респондент-1: Нет-нет, мы не можем утверждать, что, если не находим их декларации, то они скрывают, потому что они могут не подходить… — Респондент-2: если те, которые, мы думаем, они больше, там вероятность намного больше, что не опубликуют. Это уже действительно, сигнал. — Респондент-1: Может быть ситуация, что они не обязаны по закону публиковать. Это то, что Андрей объяснял, что… — Респондент-2: Это неважно. If we find that those people, compared to the other people of same region, same function, are more likely to not to show up, it’s a signifier. It is a proof. — Юлия: То есть вы берете список людей, которые ответственны за госзакупки, смотрите, на кого распространяется антикоррупционное требование. И вы хотите проверить гипотезу, а будут ли они при этом показывать свою декларацию или нет? В смысле, можем ли мы найти их на органах госвласти и сохранились ли они в архивах. Это очень многоступенчатая сложная гипотеза, трудно… — Респондент-2: Пойми, это первое. Если мы их найдем, тогда мы можем проверять стоимость машин, можем сравнить. Потому что у них должность та же самая, тот же самый... — Юлия: Но у вас при этом будет, что один человек – у него есть декларация, и вы знаете, какая у него машина, а другой человек — у него нет декларации, и вы не знаете, какая у него машина. — Респондент-1: На самом деле, у Куна база ГИБДД со всеми машинами Российской Федерации, распарсенные, включая номера машин, потому


что у него тема, ему нравится, он хочет найти коррупцию в номерах машин из серии: 111, 222, 333, ну и до…

— Юлия: Это хитрый такой, с подвыподвертом.

— Андрей: Красивые номера, да?

— Андрей: Да, по органу — да. Я извиняюсь, я пропустил. Орган у нас записан, как правило, наименование официальное его.

— Респондент-1: Да. — Юлия: То есть это будет косвенный знак того, что номер купили, а значит, человек коррумпированный. — Респондент-1: Да, до 2015 года, когда их… — Респондент-2: Ну это как паттерн, конечно. Если уже больше таких людей, это уже интересно. — Респондент-1: У нас есть идея, что можно непосредственно брать фамилии и пытаться привязывать. Это один момент. Смотреть, есть ли декларация, и что там в декларации. Другой вариант – если нет фамилии ответственных за закупку, но мы знаем, кто является закупщиком, заказчиком, мы можем посмотреть, что творится с декларациями по этому ведомству, ну, хотя бы нам просто средний доход, и мы можем посмотреть на средний доход разных заказчиков, задекларированный и прилинковать к коррупции в госзакупках. У нас же тоже есть свои способы измерения коррупции в госзакупках, и мы можем показать, есть ли значимое влияние, связь между доходом, задекларированным, и коррупционными паттернами поведения, которые мы находим в закупках.

— Респондент-1: Меня интересует, можно не только ли по фамилии искать, а по органу?

— Респондент-1: По названию? То есть вы не используете ИНН, ОГРН? — Андрей: Нет, ИНН мы не используем, мы думаем к этому прийти, но пока мы этот не используем. Мы думали про добавление ИНН и органов, и у персон, там, где их можно найти. — Респондент-1: У органов они всегда есть. — Юлия: Там у органов — да, а с людьми, наверное, будет сложнее, потому что по закону о персональных данных мы не можем объединять базы данных, цель которых изначально разниться. Это нарушение закона о персональных данных. Если мы соединим ИНН человека с его декларацией… — Респондент-2: 06:25.

То есть, если, соответственно, вопрос с фамилиями понятно, вопрос то, как записаны органы, в которых они работают.

— Андрей: Вот. Ну, ИНН органа — тут, понимаете, есть еще другой вопрос, про вариативность органов власти. Мы отслеживаем ее. Возможно, мы сейчас будем, мы можем взять на себя задачу – добавить ИНН в Декларатор и заполнять ИНН для органов власти, как минимум, до какого-то федерального уровня, ключевых органов. Там просто вопрос того, что они могут на протяжении 10 лет менять название, менять ИНН, реформироваться, перепридумываться.

— Юлия: Ну вы поиск-то по Декларатору можете осуществлять по ФИО…

— Респондент-2: У нас тоже название? Или только ИНН?

— Андрей: Во-первых, у каждого опубликованного в базе файла, это через API не отдается, но это можно отслеживать, и статус. А является ли он полностью расшифрованным, то есть перенесенным в машиночитаемую базу или не полностью? Тут же вопрос какой? Если вы ищете какое-то ФИО и не находите его у нас, может быть, он у нас еще в базу не перетянут. Но сейчас, во-первых, мы надеемся, что у нас будет намного больше данных распарсено, какой-то горизонт надо временной задать, но это будет, соответственно, мы можем отслеживать, что есть некие органы, в которых, мы точно знаем, что все данные распарсены или вручную перенесены.

— Респондент-1: Нет, конечно, у нас есть название. Что значит «только ИНН»? Просто да, с названиями засада в том, что названия могут меняться. ИНН – это все-таки чуть более стабильная штука, нежели чем название. Ну там ИНН, ОГРН и КПП – они дают уникальную идентификацию, то есть только одному могу соответствовать. А вот названия могут быть вариативны в этом смысле.

Вы можете по этому органу осуществлять поиск по фамилиям, если у вас есть фамилия ответственного лица или предполагаемых нескольких ответственных лиц, можете совершенно спокойно их искать и уже, соответственно, получать какие-то данные: есть эта декларация или ее нет, и анализировать какие-то данные по доходам. То есть, есть некие параметры полной обработки данных.

— Респондент-2: Ну, конечно, у нас были и название, и фамилия. Тоже уникальность, уже близко к уникальным, скажем. ИНН лучше, конечно… — Респондент-1: Просто с ИНН проще, у нас 100 тысяч заказчиков. А так это придется еще думать, как писать скрипт, чтобы две базы попытаться объединить. — Андрей: Чтобы найти пересечение по органам, если есть ИНН – это проще. Но пока их нет. — Респондент-2: У нас база уже ИНН и названия. Все-таки можно попробовать. И когда мы найдем какой-то… — Андрей: А у вас база закупок? — Респондент-1: Да.


— Респондент-2: Закупки. — Респондент-1: Ну, Бегтин их тоже собирает. — Андрей: Вы у Бегтина ее забираете? — Респондент-1: Нет, мы сами ее собираем. — Андрей: С официального сайта? — Респондент-1: Да. Ну, есть варианты, когда через FTP выкачивается, но мы, например, брали не через FTP, а через официальный сайт. — Андрей: zakupki.gov.ru. — Респондент-1:Да. Ну, как бы там несколько покупается IP, чтобы они не выкидывали, ну, и, в общем, это занимает определенное время. Там есть некоторая погрешность, потому что в FTP почемуто не все попадает, что есть на официальном сайте закупок, там все равно приходится к официальному сайту закупок обращаться, потому что документ, ссылки в FTP, на самом деле, лежат на сайте. Ну как бы вытаскиваем протоколы, вытаскиваем контракты. В общем, мы пытаемся вытащить все, что там лежит практически. — Андрей: И переводите тоже в какой-то унифицированный формат? — Респондент-2: Да. — Респондент-1: Ну, как бы у нас тоже есть архив со всеми изначальными документами, и мы в XML это трансформируем, чтобы потом работать в статпакетах.

— Андрей: То есть вам нужна выгрузка сырых файлов по одному региону и машиночитаемое тоже, что есть по тому же региону? И просто вы начнете ковыряться и придумывать, что с этим можно сделать. Да? — Респондент-1: Ну, и тогда мы сможем к вам вернуться через какое-то время и рассказать, что у нас получается. — Респондент-2: Мы проверим, работает ли, и если работает… — Андрей: Ну, смотрите, в исходных файлах, там надо тоже понимать, там какая картинка? Там есть doc и xls – они, как ни крути, в большей части файлов есть встроенная функция поиска по тексту. Даже не функция, они позволяют… то есть там есть jpeg, там есть pdf отсканированные, есть еще какие-то странные вещи – даже zip-архивы, но в среднем вы найдете много файлов, которые, вы их откроете, внутри у вас текст. В принципе, возможно программное решение, которое какую-то вашу фамилию открывает и в каждом файле ищет. Не банальная задача такая. Ну мы когда уже наберем базу и циферки, практически можно за данными в Декларатор непосредственно не обращаться, а обращаться только за фамилией и смотреть, составлять какие-то, искать. Ну, идея понятна, да? — Респондент-1: Да.

— Респондент-2: Так, ну надо скрипт. И перечень наших органов им. Ваш архив. И тогда посмотрим, найдем ли мы.

— Андрей: Тоже встретится много сложностей на пути, но такой подход… Так что вот так. Не, ну давайте, мы это сделаем. Какой регион?

— Респондент-1: Просто можно попробовать по какому-то одному региону для начала провести, чтобы понять, насколько это… Я так поняла, регионы-то у вас есть.

— Юлия: Надо брать какой-нибудь, типа Калининград или Санкт-Петербург, которые более или менее.

— Андрей: Да. — Респондент-1: Если попробовать выгрузить у вас один регион целиком, и мы попробуем, как это связывается и через что. — Юлия: регион – в смысле это сырые данные, сырые декларации, которые собраны с региона 11:52, не переведены в машиночитаемый вид. — Респондент-1: Ну, можно эти, если есть машиночитаемый. Хотелось бы сырые в машиночитаемый вид, и тогда мы, посмотрев на это, сможем сказать, предложить какой-то алгоритм, как эти базы можно линковать. Ну и, в принципе, если мы будем их линковать, мы можем и проставить ИНН всем вашим организациям, потому что у нас они есть, мы через ID работаем, мы с названиями стараемся не работать. — Андрей: И в качестве ID вы используете ИНН? — Респондент-1: Да. У нас есть и все остальное, но нам достаточно ИНН.

— Андрей: А, да, у нас есть регионы, по которым у нас существенно выше покрытие машиночитаемой части. — Андрей: Да, и вот Калининград, там близко к 100%. — Юлия: Ну да, просто там у нас есть отделение. — Респондент-1: Тогда лучше Калининград, потому что по нему будет меньше закупок. Ну то есть проще на не очень большом массиве посмотреть. Потому что по Санкт-Петербургу их будет много. — Андрей: Круто, давайте Калининград. — Юлия: Калининград вообще самый классный, потому что ребята молодцы, максимально используют, занимаются переводом из года в год в машиночитаемый. — Андрей: Да, единственное что – они публикуются весной за предыдущий год, за 17-ый год они, скорее всего, еще не обработаны, они относительно недавно опубликованы.


— Респондент-1: А, ну у нас вообще большинство данных сейчас вообще по 94 ФЗ, то есть до 2013. То есть нас это вполне устраивает.

— Респондент-2: Очень интересный проект, кстати.

— Андрей: Хорошо. Тогда смотрите, там какая… Ну да, машиночитаемая база, в принципе, доступна в виде дампа данных на сайте. Единственное, что это 750 мегабайт все вместе. Ну, там нужно отрезать от нее все лишнее, чтобы оставить.

— Андрей: Видишь, мы не очень пользуемся твоим гайдом.

— Юлия: Она обновляется каждый день. — Андрей: Да, каждый день. Ну, ее можно взять в любой день, ну, какой-только скрипт, который отрежет все лишнее. Вы это сами сделаете или нам это сделать? — Респондент-1: Если вы сделаете, нам, конечно, будет проще. — Респондент-2: Очень легкий вопрос. Ответ будет не тот… — Юлия: То есть для нас это программисты, часы… — Андрей: Нет, ну это не очень большие часы, да. С другой стороны, это со структурой данных если кто-то будет работать у вас… Не, ну ладно, хорошо; мы сделаем данные по Калининградской области, это, наверное, запрос такой, более или менее. А файлы в каком формате?

— Андрей: Даша еще здесь? — Даша. Да, да.

— Даша. Да, ничего страшного, естественно. — Андрей: А ты, может быть, все-таки хочешь им воспользоваться и задать какие-то вопросы нашим гостям. У нас Елена, с которой ты переписывалась. — Даша. Да, и Кун, я прочитала. Во-первых, по поводу вашей дискуссии. Вы договорились в итоге, что вы предоставляете файл, но, я не знаю, может быть, вам полезнее будет посмотреть как пользователи такого рода пытаются выгрузить и с какими проблемами сталкиваются. Ну, или это можно в дискуссии программистов отследить тоже. — Андрей: Нет, ну тут же просто речь о том, что люди будут выкачивать эти данные, что им нужны сразу все данные, все файлы исходные, они их будут обрабатывать уже своими методами, а не как пользователи же. Вы же не будете файл вручную открывать, что-то там искать? — Респондент-1: Не очень удобно. — Андрей: Да, когда речь идет о тысячах файлов… — Даша. Ну да, да. То есть это как вариант.

— Андрей: Понимаете, у каждого файла есть… ну, то есть он приписан к какому-то году и к какому-то органу власти. Вот.

— Респондент-1: Исследователей обычно интересует база данных. Чем ближе формат к базе данных, тем это интереснее. Нет, конечно, нас не вспугнешь отсутствием базы данных, но чем ближе это к базе данных…

— Респондент-1: Но они у вас же где-то хранятся? Как хранятся, так и давайте.

— Андрей: Ну понятно. У нас уже ближе к базе данных, чем просто оформленный 20:38.

— Андрей: Не, ну они хранятся в формате: файл, у него имя файла является ID в нашей системе.

— Даша. Естественно, я и говорю, что эту базу данных можно исследователю выгрузить самому, по идее? Но, наверное, не стоит мучать исследователей.

— Респондент-1: Сырые декларации.

— Респондент-1: Ну, это очень удобно. — Андрей: Хорошо. А кто у вас будет заниматься этой обработкой данных? — Респондент-1: Я попрошу – у меня есть программист, который выкачивал закупки, я попробую перед ним поставить эту задачу, если он справится. — Респондент-2: Если Сергей не сможет, то... У меня есть человек, который работает над ГИБДД. — Андрей: Над базой? — Респондент-2: Да, это 180 миллионов знаков. Сейчас он занят, но… Ну, мы, во-первых, спросим Сергея. Если он не может… — Андрей: У нас просто есть какой-то API для обращения к файлам, который используется командой, которая парсит данные. И, наверное, логично будет API этот чтобы вы задействовали, просто мне надо списать нашего и вашего программистов. Все приходит к моменту, когда программисты пообщались, чтобы они нашли общий язык. Этот API, к сожалению, не документированный.

— Андрей: Нет, это стоит, тут как раз, на самом деле, когда я говорил про то, что у нас API по доступу к файлам не документирован, наверное, глобально проще это решить тем, что мы его документируем и документацию выкладываем в открытый доступ и передаем вашему Сергею или не Сергею… То есть, чтобы это все было. И я думаю, что мы… То есть этот инструмент API-доступ к файлам, до недавнего времени мы его воспринимали как технический, внутри нашей команды, который уже работает; видимо, надо его немного более широко открыть для всех. Предполагаю, что первым и основным потребителем будете вы. — Даша. Да, я поэтому, в связи со своим гайдом, думала, что, может быть, у исследователя появятся какие-то предложения, что включить в справочную информацию, какой-то ликбез, как работать с базами, как их выгружать. Такого плана вещи.


И еще в начале вашей дискуссии. Я правда могла не совсем понять, потому что это было самое начало, когда я подключилась Кун говорил, что если сравнивать очень похожие позиции, один и тот же регион, похожие регионы, похожие функции, но что-то различается в декларациях, какие-то машины есть или нет или разные классы машин. То есть это может быть интересно в плане того, что показывать на первой странице, в таких «сенсационных» данных. Если я правильно поняла. — Андрей: А, я только сейчас понял, что Вы имели в виду. Что у нас есть люди, которые занимают одну и ту же позицию в разных регионах…

насколько сильно различается заработная плата. Вы об этом говорили? — Респондент-1: Нет, мне кажется, что у них сейчас не настолько жесткая тарифная сетка, что во всех регионах они должны получать. Нет, скорее, разница внутри каждого региона. Там, грубо говоря, я наобум открыла один регион, там идет полтора, полтора, полтора, четырнадцать миллионов. — Андрей: Зарплата? — Респондент-1: Да. И чем больше вот этих выбросов и чем сильнее этот выброс, тем больше вопросов.

— Респондент-1: Да, но у них разные доходы, разное имущество и разные машины.

— Респондент-2: По недвижимости, например. Если недвижимость больше, чем 10 лет зарплаты. Это же странно.

— Респондент-2: Да. И у нас же есть индикаторы, какие крупные, какие – нет. Есть какая-то корреляция между машиной, недвижимостью и крупной структурой. Очень интересно сравнивать.

— Юлия: Здесь много вещей. Во-первых, недвижимость, могут быть всякие наследования, и доход же в себя включает не только тот доход, который они получают у себя на госслужбе, но и вообще доход.

— Респондент-1: Как-то так, связанные вопросы, мы ходим вокруг да около. Соответственно, нету никаких рейтингов коррупции. И нам они нужны.

— Андрей: Например, продажа недвижимости.

— Андрей: Регионов? — Респондент-1: Да, по регионам. Соответственно, насколько можно на основе вот этого строить некоторые индикаторы? Самый простой индикатор – разброс доходов чиновников в регионе. — Юлия: Дело в том, что на региональном уровне очень плохо расшифрованы декларации. — Андрей: Есть еще другие вопросы, конечно, они связаны, во-первых… Нет, ну тут даже если мы исключим всех избранных лиц, оставим только тех, кто реально работает на госслужбе, мы получим сильный разброс, он связан может быть с разницей зарплат региональных чиновников, которые отличаются. Я вижу в этом больше не коррупционный, а социальный индикатор региональный; например, есть статистика по уровню доходов служащих субъектов федерации, зарплат, госстат собирает, и она, я подозреваю, совершенно с нашими данными… А эти данные – они про настоящее, в том смысле, что они несут за них ответственность. Мы, конечно, можем предполагать какие-то нарушения, но большая часть этих данных реальна, я глубоко в этом убежден.

— Юлия: Например, продажа недвижимости. Например, получение… — Респондент-2: Да. Но все-таки мы не будем смотреть за какого-то индивидуального человека. Мы просто сравним тех люди, о которых мы уже думаем, что они коррумпированы, и других. У нас нет еще индикатора, что они коррумпированы. Если по среднему большая разница, это все-таки очень странно. Может быть, он что-то продал. Почему он продает больше, чем другие? — Респондент-1: Ну, у нас нет задачи сказать, что вот это чиновник коррупционный. Скорее, это для исследования, нам наоборот не рекомендуется спускаться на личности. — Респондент-2: Да. Indicative evidence. Про личности ничего не говорим, потому что это слишком важно все-таки. Только про среднее. — Юлия: Ну тут, вопрос...

— Андрей: Ну, людей, граждан.

— Андрей: Нет, ну идея, которая была… Вот эти всплески. Во-первых, всплески доходов, сопоставляя их с недвижимостью, мы можем даже выявлять стоимость недвижимости какой-то. То есть если человек владеет чем-то, потом он перестает владеть и одновременно у него всплеск дохода, это значит, что он продаж эту недвижимость и мы можем, сравнив со средним доходом за предыдущие годы, например, выявить стоимость предположительную того или иного объекта, которым он перестал владеть. Это в момент его продажи, не в момент приобретения.

— Юлия: Здесь же речь идет о том, чтобы мы идентифицировали в разных субъектах федерации одни и те же должности и сравнивали бы для разных субъектов федерации, если я правильно поняла,

Да, еще там, кстати, есть сведения о расходах. Но это не очень интересная история. То есть если стоимость приобретенной недвижимости превышает совокупный семейный доход за три предыдущих

— И второе – это разброс между какой-то средней зарплатой по региону. То есть их доходы… — Юлия: Средняя зарплата по региону – средняя зарплата кого?


года, то в самом правом столбце указываются источники получения этих средств без всяких сумм. В общем, неинтересно, очень общими словами какими-то, но такие данные в каком-то виде тоже присутствуют.

доходу, доход человека и доход супруги, и в какомто другом месте доход ее и доход супруга.

Про всплески. Теоретически я вижу возможность, это не очень просто, но мы можем обозначить в каждом регионе, например, позицию альфа какуюто, которую мы присваиваем, что в этом регионе у нас 100 людей занимают эту позицию; и в каждом регионе, например, такие метки проставить. Тут будет вопрос правильности метода выбора людей, которым мы присваиваем это значение, что они входят в какую-то контрольную группу, которую мы потом сравниваем, соответственно, выявляя людей, которые выходят из этой контрольной группы почему-то в какой-то год или по региону сравниваем, где больше платят, где меньше платят.

— Юлия: Ну и еще следующий пункт — это антикоррупционная и предвыборная декларация.

Ну, например, руководители территориальных органов, территориальные представители федеральных органов исполнительной власти. Да? И с точки зрения уровня их обработки по машиночитаемой базе, там уже что-то есть, что-то проклевывается. Можно, кстати, очень интересная тема по вузам. У нас ректора и проректора вузов очень хорошо обработаны. У них есть региональные привязки. И это достаточно, там просто хороший уровень обработки. — Юлия: Ох, ну это… С региональными вузами и так... — Респондент-2: В нашей базе тогда можно проверить. Если ректор, то жена ректора – тот же самый адрес, имеет тоже машину. Мы можем даже… — Юлия: У жен и у детей имена в декларации не раскрываются. Или Вы только про ректоров говорите? — Респондент-2: Ну, у нас в базе данных есть адрес. Если мы найдем жену, у которой тот же самый адрес, у них есть столько машин, что…, тогда уже. — Андрей: Я тоже думаю, что… Но найти такие результаты… Человек, который подотчетен, он знает, что его по базе очень легко пробить, он вряд ли… Маловероятно, что там будут какие-то открытия. — Респондент-2: Ну, это, как говорится, empirical question. Посмотрим. Жен. Их дело – собрать, наше дело – выяснить. — Андрей: Да. — Респондент-2: Если найдем Вышку, тогда это конец проекта. — Андрей: Еще там есть такая опция, выявляется супруга – супруг, по нашей базе данных, перекрестным сравнением деклараций. — Юлия: На детей? — Андрей: Да. Ну, сравниваем Набиуллину с Кузьминовым и видим, что они муж с женой. То есть по

— Респондент-2: А, можно cross. — Андрей: Да. Но там, конечно, на 60 тысячах человек это пока…

— Андрей: По предвыборной нет, не рассказывал. У нас основная база – это антикоррупционные декларации. Есть еще предвыборные декларации, которые… — Юлия: Собственно, с них-то проект и начался, стали ребята сравнивать, насколько расходятся у одного и того же человека декларация предвыборная и антикоррупционная. — Андрей: Да. То есть, есть люди, которые подают несколько антикоррупционных деклараций, относительно редко, но тоже бывает, ректор вуза и одновременно депутат регионального законодательного органа. А также есть еще предвыборные декларации, у них может быть другой формат, может быть такой же формат, они более вариативны, не всегда публикуются, но мы их тоже собираем, потому что дополнительный источник информации. Собираем и переводим в машиночитаемый вид, тоже не все. И они хранятся в той же структуре данных, при этом они чуть-чуть другие, например, там нет супругов. Такой слой информации тоже присутствует. — Респондент-1: Но там, при этом, есть фамилияимя-отчество всегда. — Андрей: Ну, здесь тоже есть всегда фамилияимя-отчество. — Респондент-1: Нет, ну вот у вас тут имя-отчество. — Андрей: А, инициалы. Мы как раз в процессе идентификации, мы инициалы всегда стараемся заменять именем-отчеством. Если мы просмотрим всю нашу совокупную базу, то у нас больше людей с именем-отчеством, нежели чем с инициалами. Иногда, конечно, находишь, даже не понимаем, где его искать, записываешь его как есть в базу. — Респондент-2: Я тоже думал про политические циклы в госзакупке. — Респондент-1: Это необязательно связано с госзакупками. — Респондент-2: Нет, точно? Ну, интересно всетаки. — Респондент-1: Если есть данные по выборам, по выборам вплоть до муниципалов… — Андрей: Предвыборные декларации в смысле? — Респондент-1: Нет, я имею в виду, что если есть предвыборные декларации, есть результаты выборов, есть процент проголосовавших за эти выборы. И вот это совместить – тоже очень интересная


штука. Это должно проще, наверное, совмещаться. — Региональные – да. Муниципальные… — Юлия: А по регионам же есть вот этот БИПС. — Андрей: Это только на 40. — Юлия: На фирмы. А, и на 40 регионов. — Респондент-2: Это тоже неплохо. Это какой-то опрос? — Юлия: Реконструкции и развития банк. — Респондент-2: Они задают такие вопросы… Сколько времени надо региональному администратору, сколько надо для взятки… — Юлия: От индекса коррупции региона, по-моему, в 2003 году, вместе с фондом ИНДЕМ разрабатывался индекс, даже был проведен опрос, но данные его, почему-то… Это Ирина Анатольевна может рассказать. — Респондент-1: 2003?

— Юлия: Там идея такая, что есть комиссия конкурсная, в которую входят представители разных политических сил. Там была выявлена прямая зависимость: чем более она разнородная политически, тем меньше цена контракта. Это было сделано для Владимирской области. Еще как вариант. Ну, Декларатор тут не при чем, я ушла от темы. — Респондент-1: Обычно там, кто участвует в комиссии, их фамилии тоже есть. — Юлия: Да. — Андрей: Это в документации закупки? — Юлия: Да. — Респондент-1: В документации закупки. — Андрей: Она тоже часто не машиночитаема. — Респондент-1: Ну, бывает. Бывают PDF, бывают картинки.

— Юлия: Я по датам не могу сказать.

— Андрей: Но чаще нормальные какие-то файлы или?..

— Респондент-1: Просто на сайте ИНДЕМа есть несколько срезов коррупции и там выложены базы данных.

— Респондент-1: Там разные файлы. Протоколы, как правило, нормальные; аукционная документация – там даже иногда бывают читаемые PDF.

— Юлия: Есть.

— Андрей: А что сканы самое?..

— Респондент-1: Но там тоже все заканчивается 2000- каким-то, 2009, по-моему, годом.

— Респондент-1: Обоснование резервной цены бывает сканами очень часто, картинками. И вообще, там скрипт очень много делает ошибок, потому что даже не всегда понятно, где искать. Ну, там бывают разные случаи. Я помню, я там чистила базу руками, закупка – 95 тысяч литров бензина. Ну, я потратила 10 минут, чтобы понять, какого бензина. Скрипт такой… При том, что все было в ворде, пожалуйста. Но вот октановое число…

— Респондент-2: Это Титков, Петров? — Респондент-1: Там 2005, 2009 — что-то такого плана. Там что было интересно, это тоже опросный, он не очень репрезентативен по регионам, там тоже не все регионы, но они опрашивали обычных жителей, предпринимателей и госслужащих; там есть ответы для волны 2005 года точно. Просто это очень давно и мало их. Мы обычно используем опрос, который проводился для Министерства экономического развития и торговли, Corruption Perceptions. Это единственное, что есть по всем регионам фактически. И больше по коррупции ничего такого нету, а куча кросс-региональных исследований, ну и есть на это спрос. — Юлия: Я знаю, что была еще задумка, если про какие-то исследования говорить. У нас в «Трансперенси» ребята сделали, но почему-то никогда не публиковали это – о том, как влияет разнородность политической аффилиации в комиссии, которая решает о госзакупке. Это было во Владимирской области сделано. Ты понимаешь, о каком исследовании я говорю? — Андрей: Да, да. Я был одним из тех людей, который пытался привести это исследование в вид, который пригоден для публикации ненаучной. — Юлия: Потом следующим человеком была я, а потом вообще его потеряли, этот файл. Ты можешь краткую идею? — Андрей: Нет, не помню и даже вспоминать не хочу.

— Андрей: Не нашла просто? — Респондент-1: Я нашла через 10 минут, и то, сопоставляя разные куски, я поняла, какой бензин они хотят закупить. Ну, это я уже просто из серии «исследовательский интерес проснулся», что же они закупают, где-то же это должно быть написано! — Респондент-2: Для transparency это полезно. — Респондент-1: Нет, когда большие массивы данных, понятно, что будут ошибки. Ну, просто чтобы эта ошибка не была 50 на 50, тогда нормально. Какой-то процент… — Андрей: А какой для вас процент ошибок допустимый? Например, у нас есть ошибки в базе, я знаю, я их иногда нахожу, разные: какой-нибудь объект не так типологизировали, что-то еще. У вас есть какая-то толерантность? Р— еспондент-1: Ну, 5% ошибок — это вообще норма. — Андрей: То есть 5% любых записей содержат какую-то неточность? — Респондент-1: Ну да, да. И обычно, когда проводятся исследования, там же все равно всегда гоняют робастность-check, то есть либо выборка


уменьшается-увеличивается, одних выкинул, других выкинул; если результаты стабильны, значит все хорошо. А если они каждый раз новые…

— Респондент-1: В закупках он идет вниз. — Юлия: Он вообще-то редукцион, а не аукцион.

— Респондент-2: Нам не надо знать всякий пункт. Для нас это меньше проблем. Да?

— Респондент-2: Или они ставят эту резервную цену до аукциона, когда еще не знают, кто выиграет. Там такая интересная корреляция.

— Респондент-1: Ну да, так как у нас нет задачи сказать: «Вы — фу», — но при этом, если надо, мы можем выдать списки, на кого смотреть.

— Андрей: Высокая резервная цена привлекает больше участников.

— Андрей: А почему бы и нет? Мы коллегам отнесем, они будут очень рады. Что вы там, какие списки – дальше уже руками пройдутся опять по всем тем же документам.

— Респондент-1: Нет, нет, в теории высокая резервная цена – должно приходить больше участников, и за счет конкуренции он все равно сваливаются. С точки зрения теории никто не любит смотреть на резервную цену, потому что должно элиминироваться конкуренцией. Но мы смотрим на те паттерны, что есть высокая резервная цена, она привязана к тому, кто выиграет впоследствии. При том, что ее объявляют до аукциона. То есть он не должен знать, кто выиграет этот аукцион. Просто это смотрится для одного и того же товара и выявляется, что, когда он планирует, что выиграет определенный поставщик, резервная цена оказывается выше.

— Респондент-2: Тогда я буду сразу без визы, помоему. — Андрей: Про вас никто не узнает. Я запись удалю потом. Отдадим коллегам, вручную все это заново найдут по вашей наводке. Вы карту клада дайте, а клад они сами откопают и сделают, что надо. — Респондент-1: Не, ну мы можем попробовать, сказать, что у нас… мы же смотрим на коррупцию в госзакупках. Мы можем выдать список заказчиков, которые у нас попадают под наши критерии. Это не значит, что у них все коррупционное. Нет, они рандомизируют. — Андрей: Что рандомизируют? — Респондент-1: Стратегию поведения. То есть один из методов выявления коррупции, который мы сейчас используем, - грубо говоря, фаворитизм. Можем ли мы сказать, что относительно определенных заказчиков поведение отличается? С парочкой с какой-то. — Юлия: То есть, есть какой-то паттерн того, как он обычно себя ведет, и дальше мы видим, что резко не так. — Респондент-2: Меньше конкурентность, цена там получается…

— Юлия: Но тут наблюдается паттерн того, что…

— Андрей: Чтобы он мог выше контракт… — Респондент-1: Чтобы была больше контрактная цена. — Андрей: Научно обоснованное расследование — о чем можно еще мечтать? Это же прекрасно. — Респондент-1: Если вам интересно, мы можем выдать эти пары. — Юля: Да. — Андрей: Давайте. А сколько у вас? Какой-то большой, наверное, массив? — Респондент-1: 10% из… — Респондент-2: Из пар. И 80% из аукционов. — Андрей: Давайте меняться заложниками.

— Респондент-1: Ну, например, он пытается поставит выше резервную цену, чтобы впоследствии получилась выше контрактная цена и делает это все время с одним поставщиком.

— Респондент-2: Давай, давай, давай.

— Андрей: И вы можете эти пары предоставить?

— Респондент-2: Будет, будет.

— Респондент-1: Да.

— Андрей: Нормально — нашим калининградским коллегам подкидывать работу. Не, ну там как бы заново надо исследовать каждый случай, наверное.

— Андрей: Так давайте. — Юлия: Давайте. Для нас… — Респондент-2: Цена резервная больше, но меньше компетенция в аукционе. — Респондент-1: Меньше количество очереди. То есть там идея обычно: если ставить очень высокую резервную цену в аукционах, то должно набегать большое количество участников, потому что это привлекательно. — Андрей: Что такое «резервная цена»? — Респондент-1: Откуда стартует аукцион. — Андрей: Он вниз идет?

— Респондент-1: Ну, мы как бы… А нет, у нас практически во всех регионах это есть, то есть в Калининградской будет, да.

— Юлия: Слушай, ну у нас ребята, они тоже делят свои кейсы. Когда они встречаются с коррупцией в госзакупках, у них есть свои представления о том, какие тактики использованы. — Андрей: Нет, ну, я полагаю, что это должно просто привести к тому, что нужно изучать дальше и у победителей этих сложных случаев смотреть учредителей, бекграунд пробивать. — Юлия: Нет, ну понятно. Насколько, действительно, можно доказать аффилиацию.


— Респондент-2: Это дополнительное доказательство, скажем так. Эти 11%, они очень странные. Если у них машина, которая дороже, это уже очень странно. Сейчас это уже невозможно. Это random. — Юлия: Это было бы очень здорово. — Респондент-1: Мы, правда, еще не собрали последнюю базу данных по 44 ФЗ. — Андрей: 44 — контрактный? — Респондент-1: Да. Ну, если у нас 94 – мы не успеваем в реальном времени все обрабатывать. Но, при этом, когда мы соберем 44, мы можем обновить и выдать новый результат. Если код у нас написан, и мы можем это дело прогонять и выдавать эти результаты.

— Респондент-2: Нет, это универсаль… Не важно, что они… — Респондент-1: Нет, я имею в виду, что даже если пара была между заказчиком и вертикально интегрированной компанией, то вертикально интегрированная компания никуда не денется, она не скроется за подставной фирмой. Это не индивидуальный предприниматель, который вчера был под одним номером, а завтра — под другим номером. — Респондент-2: Да, конечно, да. — Респондент-1: Они считают, что у них все хорошо. — Респондент-2: Ну, это доказательство, они будут для procurement (закупок), да? Не для…

— Муж1. А вот сейчас у вас пары – это по какому временному периоду?

— Респондент-1: Они же пара. Мы их сдадим парой.

— Респондент-1: 2011-2013.

— Респондент-2: Да, да. Но они используют только название procurer (закупщика)?

— Муж1. А, давний достаточно. — Андрей: Ну, уголовный срок давности еще не истек… — Респондент-1: Там вопрос весь в том, 44 ФЗ разбил пару или не разбил пару; если он ее не разбил, то они по-прежнему все продолжают делать; если разбил – может быть просто новое. — Андрей: Ну, там может быть же, что сейчас какие-то другие юрлица, например, работают. Ну, это все отслеживается. Что пара, которая… — Юлия: А если по ИНН… — Андрей: А какой ИНН? У тебя был один… — Юлия: Человек, учредитель. — Андрей: Да, по контрфокусу это отслеживается. — Респондент-2: Они думают, что это не видно. Потому что не видишь, только когда смотришь один проект; только видишь, когда смотришь все проекты. По-моему, там причины нет разбить какую-то пару, потому что они думают, что они в теме. — Респондент-1: На самом деле, это рынок топлива. Там, скорее всего, один из участников пары окажется один из ВИНКов. ВИНК — он не исчезнет.

— Респондент-1: Нет, почему? Они используют… Нет, им же нужно доказать коррупцию, они не могут доказать коррупцию заказчика просто так. Они доказывают… — Юлия: …что есть конфликт интересов. — Андрей: …доказать, например, что та же закупочная комиссия, ее члены – учредители этого, сотрудники-исполнители поставщика, сотрудники. И потом в конце оказывается, что жена этого – вместе в кружке по танцам… — Респондент-1: Грубо говоря, идея в том, что мы даем пары, в которых, мы считаем, есть коррупция с нашей экономической точки зрения. — Андрей: Которые надо изучать. — Респондент-2: Да, да, понял. — Респондент-1: А они роют и с формальной точки зрения находят или не находят там доказательства. — Респондент-2: Да, я понимаю. I’m only saying that you have the pairs… Procurer-buyer pairs. And the datasets – they will have very few sellers, because these are private companies, they don’t have to do declaration. They have mostly the procurers. — Андрей: We are not talking about declarations now.

— Андрей: ВИНК?

— Респондент-1: Oh, I see!

— Респондент-1: Вертикально интегрированная компания: Лукойл, Роснефть, Татнефть…

— Юлия: Нет, это больше про наши попытки выстраивать досье по конфликту интересов, большие сетки по конфликту интересов. Ну, этот – как его фамилия была? Мухомор?

— Андрей: Ну да, да. — Респондент-1: Если там с одной стороны пары – вот это, это никуда не исчезнет и никакой ИНН не поменяет. — Андрей: Ну почему? У них же там тоже дочки, внучки? Но это отслеживается, да. — Респондент-1: Дочки, внучки, но при этом они все равно. — Андрей: В конце, да, наверху сидит…

— Андрей: Мухомор — да, был такой. — Юлия: И, значит, жена — начальник департамента транспорта Калининграда, а он — начальник трамвайного депо Калининграда, частного — каким-то образом он получил трамвайное депо, както полу-частно, в общем, все там происходит. И вот она закупочки, а там есть другие трамваи, и все — Мухоморы. Мухоморы, Мухоморы; ну, тут фамилия


спалила. А у нас же был, который поменял фамилию и отчество, чтобы закупать, чтобы не пойматься на папе; тоже в Калиниградской области: папа — замгубернатора, большие закупки, а сын — глава района, поменял фамилию и отчество, чтобы аффилиации не выдались. — Респондент-1: Но вы раскопали? — Юлия: Ну да, потому что они все знают… Половина города с ним в школе училась. — Респондент-2: Это бюджет ***, давай попробуем, да. — Юлия: А тоже с закупок началось. Потому что смотрим: кривые закупки, какие-то кривые – регулярная кривая закупка. Ну, с чего бы? Ну ладно, Мухоморы вылезли мухоморами – тут понятно. А тут было непонятно. А потом: «Батюшки! Так это же Вася, который еще вчера был Петей, но теперь перекрасился, чтобы как раз выигрывать вот эти странные закупки». У вас товар — у нас купец, просто два механизма хорошо совмещаются.

— Респондент-1: Мы еще плакались, что нам хочется уровня коррупции в регионах России на ежегодной основе. — Респондент-2: Пожалуйста… — Юлия: Это вы хорошо спросили. Правильного человека, который рано поседел, сделав это в 2001 году, тогда, когда мы делали. Это просто был… Катастрофа. — Респондент-1: А так хочется. — Юлия: Просто когда мы стали… Во-первых, чего я сразу сказала? Конечно, выборку, если с эксоцем, выборка по людям – ничего, по бизнесу – ужасная, невозможная. Надо делать отдельно, потому что у них совершенно разные анкеты, в общем, все там разное. Северный Кавказ вываливается – он весь врет. Башкортостан и Татарстан вываливается – он весь врет. Нам пришлось снять поле Кабардино-Балкарии, просто потому что… — Андрей: Это вопросы дали, экспертные какие-то, да?

— Респондент-1: Да, мы только за. Не только же публиковаться — нужно же какой-то эффект…

— Юлия: Нет. Граждане, предприниматели. Либо ехать самим, все поле делать.

— Юлия: Движуху.

— Респондент-1: Рехнешься.

— Респондент-2: Да, это тоже интересно.

— Юлия: Рехнешься. А все врут. У нас такой шум получился, у нас на Татарстане получился адский шум, у нас получилось так, у нас там было от 1 до 40 уровень доверия федеральным и местным органам власти… А, «Как вы думаете, насколько коррумпированы федеральные органы власти и муниципальные органы власти?» Они ставят «абсолютно некоррумпированные», 1, федеральным и «абсолютно коррумпированные» местным. А так не может быть, это какая-то ерунда. То есть не может быть разброса 1-40 внутри одной группы отвечающих. В Вологде можно, в таких нормальных спокойных регионах можно. Но всю Россию – боюсь, нет. Минэкономразвития не открывает? Они же каждый год делают.

— Юлия: Это как? Это efficiency или efficacy. — Респондент-2: Давай, да. Еfficacy тоже. — Респондент-1: Synergy effect. — Юлия: Ну, он всегда получается каким-то образом, да. Я как раз сегодня в телевизоре молодому человеку объясняла, что нас во всем этом интересуют datasets. Как вы потом это подадите, кто на каком месте, кто кого обогнал - это уже ваше дело, вот этот пиар, продвижуха и так далее. Дайте нам наши data sets… Потому что он ко мне привязался – он прочитал статью, что какой-то человек увидел нашу динамику ИВК по Монтенегро и счел ее заказной, потому что в 2006 внезапно поднимается, потом держится, а потом внезапно падает; а в это время там пришла какая-то партия, которая пролиберальная – и тогда Transparency подкрутили ИВК, чтобы поддержать пролиберального премьер-министра, подняли ИВК; а потом, когда пришли более правые – уронили ИВК, значит, в своей ненависти ко всему правому. Я говорю: «Понимаете, у нас там data set, то есть нам абсолютно фиолетово: левый или правый премьер. Мы берем данные из мирового банка, из БИПСов из World Economic Forum, economist intelligence unit, …. Им абсолютно фиолетово, этим данным, левые пришли к правым или правые пришли к левым. Просто данные показали, что на ожидании изменения политики изменилось что-то. Потом эти ожидания упали — изменилось что-то. В общем, короче говоря, абсолютно… Дайте нам ваш data set, мы с ним что-нибудь сделаем.

— Респондент-1: Не, ну, 2010 год только есть, потому что он был официально опубликован. — Юлия: Бизнес? Или нет, граждане? — Респондент-1: Да. Corruption perception. — Юлия: А, а они бизнес делают каждый год. Они его вообще не открывают. — Андрей: По регионам? — Респондент-2: Это кто? — Респондент-1: Минэкономразвития. Ministry of Economic Development. They do not open it. — Юлия: Absolutely impossible. We almost bribed people! Because they included the average bribe including the agencies and therefore they close it, because the picture is so appalling that it’s impossible to publish. То есть они граждан публикуют, потому что граждане говорят одно и то же: ГИБДД, ме-ме-


ме… То есть, типа, какой-то общий ужас, ну… А бизнес-то говорит какие-то конкретные вещи. И единственная была статья (он был тогда замом министра экономического развития, не помню фамилию), была какая-то полемика большая на Открытом правительстве, и он сказал: «Тем более, не надо нам рассказывать, насколько тяжело бизнесу живется в коррупционной ситуации, когда мы знаем, что средний рынок административных взяток, без большой коррупции, составляет 1,7 триллиона рублей». … — Андрей: Резюмировать. У нас было две цели. Вопервых, для нашего исследования по тем вещам, которые нам нужно понимать, что пользователи Декларатора хотят. Я так понимаю, что те запросы по API и доступа к файлам мы, наверное, можем включить. Мы сделаем расшифровку частей нашей беседы, более или менее относящихся к этому вопросу. И, наверное, поймем потом, нужны ли дополнительные какие-то вопросы. И, если нужны, Даша уже созвонится отдельно, чтобы мы могли эти мнения учесть. А по взаимодействию. Я записал, что, во-первых, мы поработаем с нашими программистами, сделаем какой-то API для доступа к исходным файлам, которые будут учитывать необходимость выкачать или – как там? – напрямую получать доступ к данным по отдельному региону. И мы возьмем наш * и сделаем из него выборку по Калининградской области. Соответственно, тогда мы сможем посмотреть, как по Калининградской области… Вы посмотрите эти данные, не знаю, сколько у вас это времени займет, когда у вас какое-то понимание будет, или по ходу дела, может быть, если какие-то вопросы будут возникать, вы звоните, задавайте их. — Респондент-1: Ну да, заранее сложно сказать, потому что предполагаешь одно – открываешь данные… — Андрей: Да. Я думаю, на следующей неделе мы сможем это предоставить. … — Даша. Это данные другого рода, получается. То есть, это не по региону. — Андрей: Это я говорил, но энтузиазма не увидел ни в чьих глазах. — Даша. Просто я, наоборот, услышала empirical question большой *. Ну так, просто как вариант. В принципе, резюмируя со своей стороны, я так услышала, что очень много от коллег есть идей по стратегическому, если можно так сказать, развитию. То есть такие системы красных флагов: если контролировать те или иные переменные, ловить флуктуации при этом. То есть тут вопрос: что контролировать? Регион, орган, позицию в органе,

длительность работы. Я не знаю. Когда вы будете работать с массивом, если будут появляться такие идеи, то складывайте их куда-нибудь в свой чердачок — может быть, потом его откроем, посмотрим. — Респондент-1: Хорошо, хорошо. Ну, это структурированные данные… То есть мы стараемся вытащить обычно все, что только можно, а потом уже что-то идет в статьи, а что-то не идет в статьи, но для нас это просто очередные контроллеры – контрольные переменные в регрессиях. Когда мы строим регрессии, мы пытаемся максимально очистить и зафиксировать, для того чтобы показать, что вот он, есть чистый эффект влияния чего-то на чего-то. Чем большее количество вещей мы можем проконтролировать, тем лучше и чище результат. — Даша. Да, я именно об этом. — Респондент-1: Если говорить относительно деклараций этих ректоров и всего прочего… Нет, идея, куда запихнуть, у меня есть; у меня просто две руки, я… Меня Мария Марковна убьет тихомирно, если я еще в образование полезу. Но, на самом деле, там… Они не смотрят с точки зрения коррупции, но можно посмотреть с точки зрения коррупции, потому что там же есть еще вот эта команда Стерлигова, которая смотрит на индексы цитирования, на публикации по вузам, которые получили статус, как Вышка, национального исследовательского университета. Вот эти данные, на самом деле, декларации, интересно смотреть, как они связаны с количеством публикаций, которое они и продуцируют. Потому что про некоторые вузы известно, что для них нормально то, что для того, чтобы это повысить, они их просто покупают. — Андрей: Покупают публикации? — Респондент-1: Да. Я сама получаю постоянно рассылки из серии: «Хотите публикацию в Scopus? Это будет стоить столько-то…» В общем, там тоже есть возможность этого использования. — Андрей: Но это другая исследовательская группа. — Респондент-1: Это другая исследовательская группа, то есть это отдельная тема. Скажем так, просто нереально все переварить в один момент времени. Но я думаю, что на это спрос тоже есть. И плюс там, что было бы интересно, это возможности подтаскивания вашей базы данных к другим базам данных. Я почему задавала вот эти вопросы?.. Андрей: Естественно, это и есть цель. Над чем Даша работает? Понять… Тут есть две вещи. То есть сейчас достаточно повезло, потому что получилось, что мы под этим предлогом познакомились и вообще поняли, что мы можем взаимодействовать очень эффективно. Но у нас есть база, которая уже есть, и мы хотим понять, как вы сейчас ее можете использовать. И она станет больше. И мы вкладываем не очень много, но те ресурсы… Мы


вкладываемся в ее развитие. Мне важно как руководителю проекта понимать, что мы развиваемся в направлении, которое совместимо с интересами, в том числе, исследовательскими. Я очень жду момента, когда моя база данных будет использована какими-нибудь академическими исследователями, потому что я верю, что очень большой смысл этих данных. Такое переосмысление выводит совершенно на другой уровень. Пока это просто склад информации, находящейся более или менее в порядке.

В общем, я думаю, очень интересный может быть срез, уже машиночитаемых данных, с которыми можно работать – брать региональные законодательные собрания. Там было много уклонистов раньше (я уже это упоминал), но сейчас все более или менее нормально, последние несколько лет. И они у нас все переведены в машиночитаемый вид. Это не очень много людей – десятки людей в каждом регионе (самый большой ЗакС — 140 человек, по-моему, человек, в Татарстане), и все в машиночитаемом виде. Может быть интересно. Подумайте.

Эти данные часто используют журналисты. Они их используют в формате: «Ах, смотрите! У него 15 миллионов зарплата и Maybach!» Ну, окей, и что дальше?

— Респондент-1: То есть там темы шире, чем то, что мы обсуждали. И я не называю все темы… То есть я могу назвать много потенциально интересных идей, но выльются ли оно во что-то или нет – это зависит от того конкретно, что находится в данных, и что получается. Но этому точно есть какоето применение.

— Респондент-1: Не, ну мы, на самом деле, заинтересованы в базах данных. Мы сейчас даже запускаем проект – мы хотим создать такую большую базу данных по регионам России. Почему я плачусь относительно коррупции – показателей не хватает. Соответственно, любые прокси всячески приветствуются. Поэтому я спрашивала, что есть по регионам, понимаем ли мы, грубо говоря, количество потенциальных людей, которые попадают под Декларатор в этом регионе и количество деклараций, которые сдаются в этом регионе. То есть вот эти региональные показатели нам тоже интересны. Сейчас я пытаюсь как раз сделать – пойти от студентов; если вы готовы впустить очередного студента, который будет шариться по базам данных, я какую-нибудь такую тему попробую заявить. — Андрей: Да, конечно, я готов впускать. — Респондент-1: И если найдется студент, то создать вот эту межрегиональную картинку каких-то показателей, оценочную, чтобы попытаться сравнивать регионы между собой. Есть дофига теорий, есть теория по паблик-сектору, агентская теория относительно того, как смотрится размер зарплаты, сравнивается с аутпутом. И можно замутить идеи, связанные с тем, чтобы посмотреть, какие доходы, например, у губернаторов, у верхушки региона и как это коррелируется с экономическим развитием региона. Потому что, в принципе, этого еще никто не делал, и это один из возможных вариантов. — Андрей: Здесь у нас есть хороший массив. Если мы опять говорим, что у нас несколько регионов, которые хорошо обработаны, у нас есть некий слой, у нас по всем регионам обработаны законодательные собрания за все годы, они переведены в машиночитаемый вид. Это очень интересный массив данных, но там есть некая такая закавыка, что часто депутаты законодательного собрания не работают без отрыва от производства, они могут быть бизнесменами с зашкаливающими какими-то доходами, но при этом раскрытыми.

— Андрей: А студент — это для какого уровня? — Респондент-1: Хочу сейчас, чтобы с июля взять студентов и сделать call for research assistant лабораторию. А дальше – кто найдется. — Андрей: Да, пустим, куда угодно. Мы готовы. Пишите только, что вам надо.


Полный спектр ответов представлен по ссылке [https://docs.google.com/forms/d/1f55nFX0RCpzsRHY1_SQsM9EaAwZzTqlVOJfszeslj4/viewform?edit_requested=true#responses] Массив данных находится по ссылке [https://docs.google.com/spreadsheets/u/0/d/1Z75JbZEEEq2cEID2IU7cJ4GSf01BikvhD1FcBrlbjTQ/edit?pli=1#gi d=1330298751] Несколько респондентов оставили адреса электронной почты, чтобы получить ответ на свои комментарии. Однако, вероятно, это можно рассматривать как дружественный жест, поскольку явных вопросов никто из респондентов не сформулировал.


Цели: 1.

Как давно вы заходили на сайт в последний раз? В каких случаях вы обычно обращаетесь к этой площадке? Какие задачи вы решили с помощью declarator.org? Приведите примеры.

Проблемы, недостатки существующего: 8. Какие проблемы, недостатки вы видите в работе declarator.org? 9. Для вас лично как для пользователя какие из них наиболее существенны, затрудняют вашу работу в наибольшей степени?

Способ достижения целей: 3. Опишите свои действия на сайте для решения своей задачи/задач.

Необходимо, но отсутствует: 10. Мы поговорили о проблемах, с которыми можно столкнуться на декларатор.орг. А если говорить о вариантах развития, то как, примерно, выглядит идеальный сайт declarator.org для вас — что следует добавить? Чего не хватает сейчас? 11. Для решения каких задач и для кого еще это могло бы пригодиться, на ваш взгляд?

2.

Проследить, что из названного может быть направлением дальнейшего развития проекта. Дополнительные вопросы, если разговор не заходит спонтанно: 3.1 Какими разделами сайта вы пользуетесь? 3.2 Используете ли вы выгрузку данных в табличном виде? 3.3 Что именно вы делаете с выгруженными данными? Насколько далека выгрузка с сайта от необходимого вам вида? 3.4 С помощью каких инструментов вы проводите обработку данных? 3.5 Проверяете ли вы как-то корректность данных? Как? Модель работы: 4. Для решения этих задач вы использовали только данные с declarator.org или что-то еще? Что именно? 5. Вы работаете с данными declarator.org в одиночку или разделяете задачи в рамках сайта с коллегами? Если разделяете, то как именно? Неудачи: 6. Можете ли припомнить такие цели, которых вы планировали достичь с помощью declarator.org, но не смогли? Почему?

Комментарий: если причина связана с техническими ограничениями, то записать и обсудить в разделе 2. 7.

Вопросы задаю, если ранее эти темы не звучали. 12. Как вы считаете, насколько актуальны такие продукты сайта:  Агрегирование данных по какимлибо основаниям — по каким, например?  Обозначение связей между деклараторами — каких, например?  Настройка API;  Интеграция со статистическим инструментами;  Идентификация подозрительных деклараций; Обучение пользователя: 13. На ваш взгляд, необходима ли ознакомительная/обучающая информация о видах данных, имеющихся на сайте? 14. Как вы считаете, нужен ли на сайте некий «ликбез» по возможным способам обработки данных, путях расчетов и т.п.?

Решение этих задач вообще возможно? 15. Как вы оцениваете перспективы проекта по возможностям привлечения пожертвований?


16. Кто является перспективным жертвователем — пользователь лично/(его/ее) работодатель (корпоративная «подписка»?) 17. Лично вы стали бы участвовать в сборе денег (посылая средства или как-либо способствуя их сбору)? Почему? 18. Если ответ положительный: Какова комфортная сумма поддержки? Какие могут быть обоснования пожертвования?


АНО «Трансперенси Интернешнл-Р» 07031, Москва, Рождественский бульвар, дом 10/7, стр. 1, пом. I + 7 (495) 915-00-19 info@transparency.org.ru

Автономная некоммерческая организация «Центр антикоррупционных исследований и инициатив «Трансперенси Интернешнл-Р» внесена Министерством юстиции РФ в реестр «некоммерческих организаций, выполняющих функцию иностранного агента»


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.